维基百科:机器人/申请/MizBot
外观
< Wikipedia:机器人 | 申请
- 狀態: 已過期
- 操作者: 水樹美月(留言)
- 提請時間: 2012年10月10日 (三) 16:27 (UTC)
- 程式語言:目前使用Pywikipediabot
- 用途:目前使用半自动方式替换日本俗字为汉语规范汉字(User:水樹美月/中日不同形汉字),不知未来能否自动化。
- 討論內容連結: 参见维基百科:互助客栈/技术#是否有必要做一个机器人自动化地把那些日本俗字改为汉语规范汉字?、维基百科:自动维基浏览器/任务#「収録」→「收錄」
- 編輯時段及頻率:应该是间歇性的,几个月拿出来改一轮。
- 每天受影響頁面:
- 遵守Bots模板:这个不懂……
- 於其它語言所獲權限:无
- 是否有测试?Ben.mq 2012年10月10日 (三) 17:48 (UTC)
- 目前没有自动化,只是类似于“自动維基浏览器(AWB)”的半自动,我想还需要慢慢研究吧……总之先在这里通报一下,不知道什么时候能做得好。--水樹美月(留言) 2012年10月11日 (四) 11:01 (UTC)
- ref也應該skip.....卍田卐JC1 2012年10月11日 (四) 05:34 (UTC)
- 有道理。--水樹美月(留言) 2012年10月11日 (四) 11:01 (UTC)
- 另外既然是半自動,為甚麼不直接使用AWB?還有,機械人根本就不應該在全自動的情況下改錯字。卍田卐JC1 2012年10月11日 (四) 15:31 (UTC)
- AWB似乎是WindowsOnly的,所以不用。--水樹美月(留言) 2012年10月11日 (四) 15:36 (UTC)
- 你的意思是你不是用windows?--一個正常人 ☎ ✉ 2012年11月10日 (六) 14:36 (UTC)
- 機械人根本就不應該在全自動的情況下改錯字
有道理。应该这么说:未来要变得更智能些(例如學年別漢字配當表直接跳过),不过替换前还是需要人检查确定一下。--水樹美月(留言) 2012年10月11日 (四) 15:41 (UTC) - 這個用skip list就可以...卍田卐JC1 2012年10月13日 (六) 06:15 (UTC)
- 原来如此……谢谢您的提示~--水樹美月(留言) 2012年10月14日 (日) 10:59 (UTC)
- 原本也是(+)支持的,可惜Ben.mq摧毀了這一切。--一個正常人 ☎ ✉ 2012年11月9日 (五) 03:53 (UTC)
- 谢谢,不过我目前似乎也不是很需要bot权限,所以这个更像是给社群的通知吧。--水樹美月(留言) 2012年11月9日 (五) 11:35 (UTC)
- 原本也是(+)支持的,可惜Ben.mq摧毀了這一切。--一個正常人 ☎ ✉ 2012年11月9日 (五) 03:53 (UTC)
- 原来如此……谢谢您的提示~--水樹美月(留言) 2012年10月14日 (日) 10:59 (UTC)
- AWB似乎是WindowsOnly的,所以不用。--水樹美月(留言) 2012年10月11日 (四) 15:36 (UTC)
- 另外既然是半自動,為甚麼不直接使用AWB?還有,機械人根本就不應該在全自動的情況下改錯字。卍田卐JC1 2012年10月11日 (四) 15:31 (UTC)
- 有道理。--水樹美月(留言) 2012年10月11日 (四) 11:01 (UTC)
- ref也應該skip.....卍田卐JC1 2012年10月11日 (四) 05:34 (UTC)
- 一个月了,目前进展怎么样?先前的测试跑的太快了。如果没那么频繁的话还是可以接受的--Ben.mq 2012年11月9日 (五) 12:23 (UTC)
- 那只是我按Y按得很快而已……诶?我一分钟最多5~6个吧?--水樹美月(留言) 2012年11月9日 (五) 12:58 (UTC)
- 你怎么把它封掉了……这又不是要天天改,看到某些条目有日语模板之后我已经断了自动化的念头了,估计一轮改完下一次改也得很久以后了,--水樹美月(留言) 2012年11月9日 (五) 12:58 (UTC)
- 因为对于具体的“半自动”方法是什么方法不清楚,所以当时对于涉及字词修改的机器人先行封禁,因为机器人改字理论上应该避免。目前已经解封,如果有新的测试计划或者说有什么其他新的计划请提出来--Ben.mq 2012年11月9日 (五) 21:57 (UTC)
- 谢谢解封。它是一个上百行的批处理,每一行都是类似于“python replace.py -ns:0 拠 據 -search:拠”这样的。现在我把它列在了User:水樹美月/中日不同形汉字后面。执行之后会提示,再对要改的条目按Y,不要改的按N,就可以了。其次,我当时已经在客栈进行了讨论[1],有管理员也做过同样的操作维基百科:自动维基浏览器/任务#「収録」→「收錄」,我早就在“讨论链接”那里注明了。
- 因为对于具体的“半自动”方法是什么方法不清楚,所以当时对于涉及字词修改的机器人先行封禁,因为机器人改字理论上应该避免。目前已经解封,如果有新的测试计划或者说有什么其他新的计划请提出来--Ben.mq 2012年11月9日 (五) 21:57 (UTC)
维基百科:机器人说:没有社群的批准,bot不能用于拼写检查和纠正错字,以及处理繁简转换问题;但是我显然经过了社区讨论。当时的讨论中,大家都认为中文版(除了介绍“日语中的汉字”之类的特殊条目之外)不应有日语汉字,不过对于使用什么技术有分歧而已。--水樹美月(留言) 2012年11月10日 (六) 08:28 (UTC)
另外对于“歴 歷 曆 暦”的繁简转换我有点疑问。台湾正体可以用「教育部國語辭典」确认台湾正体是异于日语汉字的(日语汉字里面两个木,台湾正体里面两个禾),但是很奇怪,简中模式下,歴 歷 曆都能转成历。暦不可以转成历。您切换一下字型,用“不转换”“简体”“繁体”分别看看就知道了。
此外,港澳繁体有什么字型上的规范可以参看?港澳的“歷”字莫非有所不同?--水樹美月(留言) 2012年11月10日 (六) 08:58 (UTC)
- 歷、曆皆可簡化成历。--一個正常人 ☎ ✉ 2012年11月10日 (六) 09:22 (UTC)
- 谢谢指教。那么歷 曆就是繁体中文的正字,歴 暦是日本战后的新字体了。--水樹美月(留言) 2012年11月10日 (六) 11:37 (UTC)
- 來試一下:把Wikipedia:AutoWikiBrowser/Sandbox的內容改掉。--卍田卐JC1 2012年12月22日 (六) 15:56 (UTC)
- 有沒有測試來說一聲,不測試的話三天後存檔。卍田卐JC1 2013年3月2日 (六) 12:52 (UTC)
- 來試一下:把Wikipedia:AutoWikiBrowser/Sandbox的內容改掉。--卍田卐JC1 2012年12月22日 (六) 15:56 (UTC)
- 谢谢指教。那么歷 曆就是繁体中文的正字,歴 暦是日本战后的新字体了。--水樹美月(留言) 2012年11月10日 (六) 11:37 (UTC)