维基百科:机器人/申请/WhitePhosphorus-bot/2
- 状态: 已批准
- 操作者: 砜中嘌呤的白磷萃取 打谱
- 提请时间: 2017年2月5日 (日) 18:04 (UTC)
- 自动化程度:全自动
- 编程语言:Python
- 用途:清理Category:引文格式1维护:未识别语文类型
- 源代码连结: 部分代码见下
- 编辑时段及频率:不定期运行,编辑频率最大60/min
- 受影响页面:上述分类中的条目数,截至申请时为14,818。
- 遵守机器人规范:不相关
- 已有机器人权限:是
- 其他信息:
sub_dict = {
r'中文\s*[((](简体?|簡體?)[))]|[简簡]体(中文|[汉漢][语語])': 'zh-hans',
r'中文\s*[((]繁[体體]?[))]|繁体(中文|[汉漢][语語])': 'zh-hant',
# r'中文|[汉漢][语語]|[Cc]hinese': 'zh', 这句会有问题(不符合上面两句的都只会把“中文”替换成“zh”),第一轮先不用
r'英[语語文]|[Ee]nglish': 'en',
r'日[语語文]|[Jj]apanese|ja-JP': 'ja',
r'法[语語文]|[Ff]rench': 'fr',
r'荷[兰蘭]?[语語文]|[Dd]utch|[Nn]ederlands': 'nl',
r'德[语語文]|[Gg]erman|[Dd]eutsch': 'de',
r'俄[语語文]|[Rr]ussian': 'ru',
r'(韩|朝鲜?|韓國?)[语語文]|[Kk]orean': 'ko',
r'意(大利)?[语語文]|[Ii]talian': 'it',
r'希伯来[语文]|希伯來[語文]|[Hh]ebrew': 'he',
r'塞尔维亚[语文]|塞爾維亞[語文]|[Ss]erbian': 'sr',
r'立陶宛[语語文]|[Ll]ithuanian': 'lt',
r'乌克兰[语文]|烏克蘭[語文]|[Uu]krainian': 'uk',
r'土耳其[语語文]|[Tt]urkish': 'tr',
r'西班牙[语語文]|[Ss]panish': 'es',
r'拉丁[语語文]|[Ll]atin': 'la',
r'[及与與和、]|and': ',' # 放在最后比较安全
}
- 估计还有很多可以改的地方,我会等第一轮清完再看情况改代码进行后续工作。
- 以上。 --砜中嘌呤的白磷萃取 打谱 2017年2月5日 (日) 18:04 (UTC)
- 那中间出现“ and ”那该怎么办?--水中捞跃 2017年2月6日 (一) 07:42 (UTC)
- 我建议最好是把字典打散,每次执行只替换一个正则内容,然后手工抽查没啥问题后,再执行下一条替换。以上建议只是为防止bot出错,如果正则已经基本穷尽了各种可能性,那么一次过执行也未尝不可--百無一用是書生 (☎) 2017年2月10日 (五) 07:32 (UTC)
- 确实有道理,毕竟这个也不急。那几个小语种(上文意大利语到拉丁语)我想放一起执行,应该一共也没多少。 --砜中嘌呤的白磷萃取 打谱 2017年2月10日 (五) 14:30 (UTC)
- 我建议最好是把字典打散,每次执行只替换一个正则内容,然后手工抽查没啥问题后,再执行下一条替换。以上建议只是为防止bot出错,如果正则已经基本穷尽了各种可能性,那么一次过执行也未尝不可--百無一用是書生 (☎) 2017年2月10日 (五) 07:32 (UTC)
- 正式批准运作--百無一用是書生 (☎) 2017年2月13日 (一) 09:15 (UTC)