如何清洗印尼手机号码并标准化为11位有效格式
技术百科
霞舞
发布时间:2026-01-23
浏览: 次 本文提供一个健壮的python函数,用于批量清洗手机号列表:移除空格、连字符、加号等非数字字符,自动补全国家代码“62”,并校验最终是否为以“62”开头、总长13位(即“62”+11位数字)的有效号码;无效号码统一替换为字符串 `'invalid number'`。
要实现符合印尼规范的手机号清洗逻辑,关键在于三步:标准化(去除非数字字符)→ 补全前缀 → 校验长度与起始码。原始代码存在多个问题:未真正执行字符串清理(translate 用法错误且未赋值)、未处理已含 62 或 +62 的情况、缺少有效性判断与异常替换。
以下是完整、可直接运行的解决方案:
import re
def clean_phone_number(phone_list):
cleaned = []
for num in phone_list:
# 步骤1:仅保留数字字符
digits_only = re.sub(r'\D', '', str(num))
# 步骤2:标准化前缀 —— 若以 '62' 开头且长度为13,则保留;若以 '08' 开头(常见印尼本
地号),替换为 '628';否则尝试补 '62'
if digits_only.startswith('62'):
candidate = digits_only
elif digits_only.startswith('08'):
candidate = '62' + digits_only[1:] # 去掉开头的 0,补 62
else:
candidate = '62' + digits_only
# 步骤3:严格校验 —— 必须是 13 位纯数字,且以 '62' 开头
if len(candidate) == 13 and candidate.startswith('62') and candidate.isdigit():
cleaned.append(int(candidate))
else:
cleaned.append('Invalid Number')
return cleaned
# 测试数据
phone = [
'82123321123',
'082321123321',
'+6282-456-654-456',
'+62 82 789 987 789',
'14045',
'82145-451-145'
]
result = clean_phone_number(phone)
print(result)
# 输出:[6282123321123, 6282321123321, 6282456654456, 6282789987789, 'Invalid Number', 6282145451145]✅ 关键说明:
- re.sub(r'\D', '', ...) 高效清除所有非数字字符(包括 +, -, 空格等),比手动遍历更可靠;
- 对 08 开头的号码(如 '082321123321')特殊处理,转为 '6282321123321',符合印尼运营商惯例;
- 最终校验强制要求 len == 13 and starts_with('62') and isdigit(),确保仅接受标准印尼号码(62 + 11位);
- 返回结果中有效号码为整数类型(如 6282123321123),便于后续数值操作;无效项保持字符串类型,语义清晰。
⚠️ 注意事项:
- 该函数不依赖外部库,仅需内置 re 模块;
- 输入支持混合类型(如含 None 或浮点数?建议预处理),本例中已用 str(num) 做基础容错;
- 如需支持国际号码扩展(如带 +62 但数字不足),可在 candidate 构建后增加截断或填充逻辑,但根据题意,严格拒绝非11位主体数字,故不做宽松处理。
此方案兼顾准确性、可读性与工程鲁棒性,可直接集成至数据清洗流水线。
# 提供一个
# 多个
# python
# 数据清洗
# 可在
# 如需
# 三步
# 可直接
# app
# 不做
# 字符串
# git
# len
# 遍历
# 若以
# 整数类型
# 字符串类型
# elif
# python函数
# number
# 印尼
相关栏目:
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
AI推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
SEO优化<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
技术百科<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
谷歌推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
百度推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
网络营销<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
案例网站<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
精选文章<?muma echo $count; ?>
】
相关推荐
- Windows10系统更新错误0x80070002
- Win11如何暂停系统更新 Win11暂停更新最长
- Win11怎么设置按流量计费_Win11限制后台流
- Drupal 中 HTML 链接被重复转义导致渲染
- Python 中将 ISO 8601 时间戳转换为
- 如何在Golang中处理通道发送接收错误_防止阻塞
- Golang如何避免指针逃逸_Golang逃逸分析
- c++ namespace命名空间用法_c++避免
- Windows 10怎么隐藏特定更新补丁_Wind
- Mac怎么给文件夹加密_Mac创建加密磁盘映像教程
- Win10怎样清理C盘阿里旺旺缓存_Win10清理
- 使用类变量定义字符串常量时的类型安全最佳实践
- Python异步网络编程_aiohttp说明【指导
- Win11怎么开启移动热点_Windows11共享
- MAC怎么在照片中添加水印_MAC自带编辑工具文字
- Win11怎么禁用键盘自带键盘_Win11笔记本禁
- 如何高效识别并拦截拼接式恶意域名 spam
- C++中的constexpr和const有什么区别
- Windows10怎么备份注册表_Windows1
- Win11怎么恢复出厂设置_Win11重置此电脑保
- Windows 11如何查看系统激活密钥_Wind
- Windows10系统服务优化指南_Win10禁用
- 如何在Golang中处理模块冲突_解决依赖版本不兼
- php怎么下载安装后无法解析php文件_服务器配置
- Win11怎样安装微信开发者工具_Win11安装开
- 如何在Golang中实现服务熔断与限流_Golan
- Windows10如何更改盘符名称_Win10重命
- C++如何使用std::transform批量处理
- MAC怎么用连续互通相机里的“桌上视角”_MAC在
- php8.4如何实现队列任务_php8.4redi
- Windows 10怎么把任务栏放在屏幕上方_Wi
- Python函数参数高级用法_默认值与可变参数解析
- Win11关机快捷键是什么_Win11快速关机方法
- Go 中 defer 在 goroutine 内部
- c++输入输出流 c++ cin与cout格式化输
- Python代码测试策略_质量保障解析【教程】
- Windows10电脑怎么查看硬盘通电时间_Win
- 如何用正则与预处理高效拦截带干扰符的恶意域名
- c++ reinterpret_cast怎么用 c
- Win11怎么设置开机自动连接宽带_Windows
- php8.4如何配置ssl证书_php8.4htt
- LINUX如何开放防火墙端口_Linux fire
- c++的static关键字有什么用 静态变量和静态
- Win11怎么设置指纹解锁 Win11笔记本录入指
- Win11怎么设置任务栏大小_Windows11注
- Win11怎么更改电脑名称_Windows 11修
- Python包结构设计_大型项目组织解析【指导】
- Win10怎样设置闹钟贪睡时间 Win10闹钟贪睡
- 如何在 Go 中调用动态链接库(.so)中的函数
- php串口通信波特率怎么选_根据硬件手册设置正确波


QQ客服