维基百科讨论:繁简处理/档案6
本页是以往讨论的存档。请勿编辑本页。若您想发起新讨论或重启现有讨论,请在当前讨论页进行。 |
能不能把目前的共识写到Wikipedia:繁简处理
其实有些人只想知道目前的共识。 没有必要然所有人都从头看一遍讨论吧。--zy26 17:54 2004年8月4日 (UTC)
- 说得对。可是到目前为止我所看到的共识用两句就可以说完:
- 最终目的:中文维基百科只维持一个版本(而不分作一个繁体中文维基百科和另一个简体维基百科),利用程序把条目作机器繁简体转换。
- 现时处理方式:尽量维持一题目一版本(繁简混合)。 --Lorenzarius 18:04 2004年8月4日 (UTC)
- 现在的程序进度如何,有没有具体细节……--zy26 18:43 2004年8月4日 (UTC)
- 没有。程序还未开始开发。有很多不同的运作方案(见以前讨论),但都没有进一步的综合讨论。 --Lorenzarius 19:09 2004年8月4日 (UTC)
- 还以为在那里藏着呢……--zy26 20:22 2004年8月4日 (UTC)
- 我在前面的建议就是先只修改一点点Wiki的程式。让我们能用人工的方法,大家自愿性的为繁体的补充简体,为简体的补充繁体。只要能修改到10%,总查阅次数到达50%的热门网页(随便猜的数字),很多人就会比较习惯。先用最笨的方法解决眼前的问题,长远的解决方案可以等以后再推行。-- Toytoy 06:39 2004年8月8日 (UTC)
- 有个建议,我们是不是该在首页欢迎词中,设置一个连结,让一开始到这边的人就可以了解我们对于繁简体问题的共识呢?--16:34 2004年8月7日 (UTC)是我....忘了Log in--虎儿 16:35 2004年8月7日 (UTC)
- IP暴露了不是,准备接受攻击:)个人感觉还是放到{{welcome}}里面比较好。--zy26 17:28 2004年8月7日 (UTC)
- 始终我们的界面、首页内容还是以简为主。看惯繁体的人一来到,先入为主,不免还是会有疑惑,甚至是对这里有抗拒(我第一次来的时候(02年10月),看到全是简体我掉头就走了)。我想这是这里台湾用户不多的原因之一。在当眼的地方解释清楚也好。 --Lorenzarius 17:03 2004年8月7日 (UTC)
- 我附议这个。--密尔希弗拉雪 17:30 2004年8月10日 (UTC)
- 那就放到导航条里好了……--zy26 17:28 2004年8月7日 (UTC)
繁简合并
现时处理方式:尽量维持一题目一版本(繁简混合) 那么是不是现在就应该开始合并繁简版条目了?(如:日本/繁 日本/简合并为日本)不然两边要是不同步了,将来会很麻烦的... (而且好像已经不同步了......) 短期内可能会显得很乱(繁简混杂),但是只要在显眼处把繁简体问题共识解释清楚,我相信大家还是可以理解的。 -- Ran 17:05 2004年8月10日 (UTC)
- 同意。但想先看看其他维基人的意见。 --Lorenzarius 18:04 2004年8月10日 (UTC)
不如投票吧。
投票
本投票已经停止。
投票结果:
- 全部合并:6票
- 维持现状:1票
- 有限度的合并:4票
决议:条目名称繁简用语相同的合并,其他仍然保留繁简体两个版本。(不是条目的页面暂时维持现状)
(如有不同意见请继续讨论)
- 繁简版条目(如中国 中国;日本/繁 日本/简)应该现在就开始合并,只保留一个版本,另外一个改成重定向。条目里采用繁简混合的形式,同时在显眼处把我们现在的共识写出来(不然新来者一看到繁简混杂的局面,恐怕也没有什么好印象......)。
- 维持现状
- zhouxiao:个人觉得也是维持现状比较好——条目并不是大问题,问题是内容,总不能在每个字后面都加个括号吧
当然,如果完全分开的话,也可能在两个版面各说各话了,可以考虑在比较醒目的地方加上转换连接 (能即时转化就更好了,不过对效果实在没法报太大期望,最多只能参考而已)
- 密尔希弗拉雪的建议(见下)
- 最好是在条目之下,立即注明中港澳台(或日)各种汉字的写法。但是统一就保持一个版本。版本内初期简体正体并存无所谓。我那时候写了“古迹”之后,一直很惊讶简体字“古迹”在网络上资料其少无比,后来才知道名称是完全不一样的“文物保护单位”。如果两者意义其实一样,就保留一个来永续经营,其他的都redirect。Richy 11:12 2004年8月11日 (UTC)
- 我也投这个有限度的合并方案! Jose Sun 12:16 2004年8月20日 (UTC)
石添小草:我没完全看懂你的意思:假如我们能够永远保证所有的[[條目/繁]]和[[條目/簡]]除了繁简体以外就没有分别的话,那不就不用合并了吗?合并的目的就是保证[[條目/繁]]和[[條目/簡]]的内容一致啊。假如中国和中国的内容不一样,我觉得这本身就是一种不正常现象,应该尽快合并才对,不然分歧只可能越来越大。 -- Ran 09:41 2004年8月11日 (UTC)
- 我想石添小草主要的意思是指不同语言版本的翻译名称有大量且重大的差异时,是否还能顺利合并的意思吧?--泅水大象 02:33 2004年8月12日 (UTC)
- 其实条目本身的版本差异不是问题,因为可以在条目开始时详细说明各种主要版本的称呼方式,我觉得真正的问题其实是在内文里面遇到外国的名词需要翻译时,各种惯用版本的差异有时会大到简繁体乃至于香港用户互相看不懂对方意思的程度,但因为这些名词可能只占整个条目里面的一部分内容,不见得有办法关连到另一个专门说明其用语差异的条目里面(毕竟目前中文版维基的已完成条目数量有限),一两个看不懂的词汇可以用猜的,但一整串的译名、用法差异大的词汇放在一起后,我看大概已足够让人打退堂鼓放弃看下去了。为了解决此点,我通常会在第一次使用的译名后面加注原文用法,至少这可以帮助其他的朋友去关连,想想看这名词在他们的用法里是什么,但有这种习惯的维基人其实有限,再加上如果这样的作法使用过度的话,会变成整篇条目都是一堆洋文儿,又失去了中文版百科全书的意译。在原文引用的轻重拿捏之间,其实很不容易找到平衡点。
- 除此之外,如果要合并条目的话,那么一些既有的模版该如何修正才能符合共用的原则?举例来说,在‘欧洲’模版里面的‘克罗地亚’就是个至少可以让我困惑三分钟以上的用语,要不是我对欧洲国家的熟悉度,可以使用消去法过滤的话,可能永远都无法理解它原来是指‘克罗地亚’。但如果连模版这种原本是为了要简化版面让它整齐好看的工具都弄得花溜溜的放上一堆不同用法的翻译方式,就失去精简与美观的意义了......虽然原则上我赞成简繁体合并可以减少资源的浪费,但是这些问题也是同时要多加思考想办法解决的吧?--泅水大象 15:37 2004年8月12日 (UTC)
例子
关于“克罗地亚”和“克罗地亚”的问题,我觉得可以这么解决:
在Croatia这个国家的条目里,第一句话就提到:
- 大陆译“克罗地亚”,台湾译“克罗地亚”
在提到Croatia这个国家的其他条目里,尽量这样写:
- 欧盟已经同意把克罗地亚(克罗地亚)列为候选国。(或者反过来,假如整个句子都是用繁体写的那么括号里就用简体)
模版比较麻烦,我觉得可能可以做一个“对照型模版”,就是分成两行,一行放简体,一行放繁体,两行排在一起,整齐地对照,这样就解决了模版的美观问题了。(具体该是什么样子,我也没完全想好,不如我先做一个出来,看看效果如何?) -- Ran 16:25 2004年8月12日 (UTC)
做了一个大概的样子出来:(假设模版在“法国”条目里)
[[Image:Eunion.png | 30px]] | 欧盟 | |||||
---|---|---|---|---|---|---|---|
1951 | 法国 | 德国(西) | 意大利 | 比利时 | 卢森堡 | 荷兰 | |
法国 | 德国(西) | 意大利 | 比利时 | 卢森堡 | 荷兰 | ||
1973 | 英国 | 爱尔兰 | 丹麦 | ||||
英国 | 爱尔兰 | 丹麦 | |||||
1981 | 希腊 | ||||||
希腊 | |||||||
1986 | 西班牙 | 葡萄牙 | |||||
西班牙 | 葡萄牙 | ||||||
1995 | 奥地利 | 瑞典 | 芬兰 | ||||
奥地利 | 瑞典 | 芬兰 | |||||
2004 | 爱沙尼亚 | 拉脱维亚 | 立陶宛 | 波兰 | 捷克 | ||
爱沙尼亚 | 拉脱维亚 | 立陶宛 | 波兰 | 捷克 | |||
匈牙利 | 斯洛伐克 | 斯洛文尼亚 | 马耳他 | 塞浦路斯 | |||
匈牙利 | 斯洛伐克 | 斯洛文尼亚 | 马耳他 | 塞浦路斯 | |||
2007 | 保加利亚 | 罗马尼亚 | |||||
保加利亚 | 罗马尼亚 | ||||||
候选国 | 克罗地亚 | 土耳其 | |||||
克罗地亚 | 土耳其 |
- 其实不难看出,真正会有问题的国家占极少数,所以我觉得可以保留一种字体,同时在会出现问题的地方打一个斜杠(如:克罗地亚/克罗地亚)。 -- Ran 17:12 2004年8月12日 (UTC)
- 同意同意,这个模版不错。ZZZ...很困 (对话、留言按这里) 01:42 2004年8月13日 (UTC)
又做了一个,这次是用斜杠分的:
大家觉得哪种办法比较好?我个人觉得用斜杠比较方便,另外一个做起来实在太麻烦了。-- Ran 17:56 2004年8月15日 (UTC)
繁简合并实验
或者还有一个办法,就是先选几个条目进行合并,再决定要不要继续进行,这样如何? -- Ran 16:25 2004年8月12日 (UTC)
- 好吧,不如现在就开始吧,就用这两个条目。 -- Ran 12:23 2004年8月13日 (UTC)
从技术上解决才是根本--百无一用是书生 (Talk) 17:26 2004年8月12日 (UTC)
- 同意同意。ZZZ...很困 (对话、留言按这里) 01:42 2004年8月13日 (UTC)
- 对呀,只不过我们离那个目标还是太远... -- Ran 14:26 2004年8月15日 (UTC)
我现在共做完了四个繁简合并实验条目:英国/Temp、法国/Temp、加拿大/Temp和日本/Temp。具体方法是一段一段地看哪个版本的内容像原创,哪个像转换过来的,哪个像是没更新过,然后一段一段地拷贝到合并条目里。最终结果是:前两个主要是简体,第三个主要是繁体,第四个比较混杂。
大家觉得接下来应该怎么办?要不要用试验条目取代原来的繁体、简体条目?要不要继续进行合并?-- Ran 11:04 2004年8月17日 (UTC)
我比较担心的是,会有其他站友在各种情况下(例如:编辑软件自动转了码,又或是看到太多看不懂的文字而不爽),把条目整篇变成繁体或简体。明成皇后及不少其他条目就多次出现这种情况了。--石添小草 14:24 2004年8月17日 (UTC)
- 可以写一个《繁简问题共识》,链接放在显眼处,把我们在繁简问题上的共识和政策(如:繁简混杂,互不干扰)解释清楚。
- 要是还是不行的话,(比如出现比较恶性的“繁简大战”),那就只好采取比较强硬一点的政策,比如禁止大面积的繁体改简体或简体改繁体。-- Ran 15:00 2004年8月17日 (UTC)
大家还有什么建议或者意见吗?
请大家踊跃发言,不然这件事就进行不下去了......-- Ran 11:30 2004年8月18日 (UTC)
- 可以把讨论结果放到wikipedia:繁简处理中--百无一用是书生 (Talk) 11:40 2004年8月18日 (UTC)
- 大致写了一下 -- Ran 07:18 2004年8月19日 (UTC)
我觉得应该以小草的意见为准。繁简用语差异不大的条目应该合二为一,用语上差异较大的条目则仍然保持繁简两个版本。另外,是不是还可以立这样的规则:繁简体一样的条目名称全部合并?现在弄个条目/繁、条目/简,实在让人看着别扭--百无一用是书生 (Talk) 12:30 2004年8月18日 (UTC)
- 不如就从那些名称一样的条目着手吧。-- Ran 07:18 2004年8月19日 (UTC)
咦,我合并了半天的加拿大/Temp怎么突然消失了?-- [[User:Ran|ran(留言)]] 16:40 2004年8月23日 (UTC)
技术上解决
从技术上解决到底要不要考虑词汇的问题?如果考虑,应该怎么办?如果不考虑,又应该怎么办?--zy26 13:31 2004年8月15日 (UTC)
- 应该解决词汇的问题。如帕劳/帛硫。从技术角度上来讲,这个和干净/干净、干活/干活、乾隆/乾隆的道理一样。-- Ran 14:26 2004年8月15日 (UTC)
- 其实我们现在就可以先建立词汇表了,譬如说另开一个 talk,然后大家可以依照词汇的分类慢慢加入。Jose Sun 12:27 2004年8月20日 (UTC)
- 现在已经有了Wikipedia:中文繁简体对照表和译名表,可以在此基础上建立一个繁简体字典--百无一用是书生 (Talk) 17:22 2004年8月23日 (UTC)
- 一词多义的问题怎么办?--zy26 18:02 2004年8月23日 (UTC)
- 我觉得那个繁简体对照表作用不大,应该用词语为单位来做,这样会比较有用。Jose Sun (伦伦) 18:18 2004年8月23日 (UTC)
- 字汇表这里有个收得颇全的︰[1],见g2p.pl 或 p2g.pl 2004年9月4日星期六 21:42 (UTC)
- 我觉得那个繁简体对照表作用不大,应该用词语为单位来做,这样会比较有用。Jose Sun (伦伦) 18:18 2004年8月23日 (UTC)
- 一词多义的问题怎么办?--zy26 18:02 2004年8月23日 (UTC)
- 现在已经有了Wikipedia:中文繁简体对照表和译名表,可以在此基础上建立一个繁简体字典--百无一用是书生 (Talk) 17:22 2004年8月23日 (UTC)
- 一词多义?可以用消歧义解决--百无一用是书生 (Talk) 18:43 2004年8月23日 (UTC)
- 但是还是要做一个对照表啊?要不然如何消歧异?Jose Sun (伦伦) 18:46 2004年8月23日 (UTC)
- 一词多义?可以用消歧义解决--百无一用是书生 (Talk) 18:43 2004年8月23日 (UTC)
- Wikipedia-l 上有一个贴子建议一个自动/手工相结合的方案:[2],我觉得很可行。自动转换,无论做得多仔细,都会有不满意的情况出现。所以我们可以做一个很简单的自动转换程序,比如说只做字一级的转换,并且在出现一对多的情况下只取最常用的,使的所有的转换都是一对一的。然后,如果转换结果有错,就手工在文章中加特殊的wiki标记表明某个字或词该如何转换。比如:“欧盟已经同意把克罗地亚列为候选国”,之外的字用程序自动转换,之内的则根据用户的语言要求(是zh-cn还是zh-tw)相应显示。大家觉得如何? Zhengzhu 14:01 2004年9月7日 (UTC)
- oops! 没有看到以前存档的讨论,原来这个想法也讨论过了。不过好象具体编程还没开始?有谁在作这方面的努力吗? 我对这个问题很感兴趣,所以做了个粗略的程序,加到mediawiki的程序里。欢迎大家到http://s87257573.onlinehome.us/wiki/测试测试。我觉得这里面有很多细节需要考虑,不过如果有一个具体的程序的话可以使得大家的讨论更具体化。Zhengzhu 01:26 2004年9月9日 (UTC)
- 可否提供程序的源代码?另外我觉得这种方法太繁琐,不适合wiki的精神。最好能够自动转换。当然也需要部分的手工操作。我的意见是,根据zh-cn, zh-tw,甚至可以加上zh-hk,zh-sg,建立一个繁简词汇的对照表,随时添加繁简用词不同的词汇。然后用户浏览页面时,根据要求自动转换。--百无一用是书生 (Talk) 02:02 2004年9月9日 (UTC)
- 代码当然可以提供:) 现在作为初步尝试,所以只有字是自动转换的,且转换表也是粗略用程序生成的。词汇的自动转换是同样的道理,只要加入词汇转换表就行了,我可以马上加几个试试。增加zh-hk,zh-sg也是一样的道理。Zhengzhu 02:33 2004年9月9日 (UTC)
- 这个方法确实太麻烦了,可能会使编写条目的人丧失编写的乐趣;尤其对于新手,还要学习先学习、适应这种写法,太麻烦。--Xyb 02:40 2004年9月9日 (UTC)
- 可否提供程序的源代码?另外我觉得这种方法太繁琐,不适合wiki的精神。最好能够自动转换。当然也需要部分的手工操作。我的意见是,根据zh-cn, zh-tw,甚至可以加上zh-hk,zh-sg,建立一个繁简词汇的对照表,随时添加繁简用词不同的词汇。然后用户浏览页面时,根据要求自动转换。--百无一用是书生 (Talk) 02:02 2004年9月9日 (UTC)
参看Wikipedia talk:繁简处理/档案5#我来提个解决方案,我比较赞同这种方法--百无一用是书生 (Talk) 02:09 2004年9月9日 (UTC)
- 这也是我看到的比较好的方法,已经有一些繁简转换的工具在使用这种方法,比如用在Mozilla上的同文堂,和这种方法完全相同。它已经做出了繁到简、简到繁的表格,我们修改一下就可以拿过来使用。--Xyb 02:40 2004年9月9日 (UTC)
请到这里讨论Wikipedia:繁简处理/技术方案相关的技术问题--百无一用是书生 (Talk) 02:25 2004年9月9日 (UTC)
- 好的Zhengzhu 02:38 2004年9月9日 (UTC)
页面合并
在页面合并之后,会不会造成编辑历史的丢失,从而引发一些版权问题?--zy26 06:55 2004年8月24日 (UTC)
- good point. ---Djyang 15:45 2004年8月24日 (UTC)
- 另外有一个问题,可否从争议较小的页面开始合并起呢?--虎儿 03:34 2004年8月26日 (UTC)
- 早晚都要合并,现在合并得差不多了吧……--zy26 03:44 2004年8月26日 (UTC)
- 好吧!我把话挑明了讲,为什么台湾、中华民国这些条目是删繁就简?我觉得删简就繁才比较对吧!(先不论以后技术解决,因为我们今天要解决的是今天的事)今天中国、中华人民共和国这些条目删繁就简我百分之百赞成,大陆网友一上来,搜这几个条目,如果是繁体字,大概心中会也觉得有点奇怪。相同的,我找台湾同乡一上来,无论我跟他们怎么说这边大陆网友们多好多好,大家如何想要中立、做交流如同兄弟姐妹一般,看到自己惯常的家乡条目,用得(本来在想像中)是可能有敌意的简体字,我想不爽的会居多吧!繁简体不是用来争论的,毕竟这边最主要的是让大家贡献自己知识,但是我想如果在行动前能够更细腻点思考,会让大家心里舒坦点。--虎儿 12:30 2004年8月26日 (UTC)
- 先说好我没有什么繁简体的喜好。但是就技术面来看,删简就繁才是比较正确的做法吧,以后繁简转换也方便不是吗? -- Jose Sun (伦伦) 12:36 2004年8月26日 (UTC)
- 我开始也感觉从技术上也是应该删简就繁,后来想了又想,发现总是多对多的关系,怎么也不够方便。--zy26 12:58 2004年8月26日 (UTC)
- 是吗?不过繁转简理论上总比简转繁来的容易些不是吗? -- Jose Sun (伦伦) 13:15 2004年8月26日 (UTC)
- 哪个字体是先写的,就用哪个字体。关于台湾的详细资料总不至于都是大陆人写的吧?-- [[User:Ran|ran(留言)]] 14:45 2004年8月26日 (UTC)
- 先说好我没有什么繁简体的喜好。但是就技术面来看,删简就繁才是比较正确的做法吧,以后繁简转换也方便不是吗? -- Jose Sun (伦伦) 12:36 2004年8月26日 (UTC)
- 除了对已经存在的繁简页面作合并之外,是不是应该对新建页面定一个原则:规定无论新页面是繁是简就以此为主页面进行修改,页面中繁简并存,另一个语言版本作redirect。不然不断有新的繁简页面出现,合并的工作什么时候才能做完?--Alexcn 11:34 2004年9月11日 (UTC)
- 一般来说现在已经在这样做了,但鉴于维基开放的精神,总会有新人来这里建立新页面的,那么总会有重复页面产生(这也包括比如不同名字的翻译而造成的重复文章),从这一点来说,这个工作的确是无止境的。--Wing 11:50 2004年9月11日 (UTC)
- 看过目前的测试, 个人认为是不可能成功的, 方向不对. 应该依照之前的想法:
..所有条目以传统中文为真实的储存媒介, 以简体中文浏览的人, 网站加以转换. 所以可以归纳出两个条件: ..1. 所有条目的撰写人都要有[以传统中文撰写文章]的能力. ..2. 所有[能够以传统中文撰写条目的人]都[愿意]只用传统中文撰写条目
..若依照目前的情况发展下去, 以简体中文浏览的人没有问题, 但是长远来看, 会有大问题 ..1. 以传统中文浏览的人, 经常会看到白字连篇的文章.改不胜改, 因为对照表[不可能]百分之百成功 ..2. 所有条目都不能以文言撰写, 仅能以口语白话为之. 若引用文言, 极有可能无法理解, 改错更形困难.
..这是一个谨慎程度的问题, 更有可能影响日后所有华人的学习, 还请各位慎重对待. ...--西贝山人 17:37 2004年10月24日 (UTC)
- 将来繁简转换实行后,文章储存媒介很可能就用繁体,简体用户的更改在储存过程中由程式直接改成繁体。假如要求必须会打繁体字才能撰写文章的话,那恐怕中文维基也不剩几个人了,包括我们几位资深的管理员恐怕都留不住......
- 至于文言撰写的文章,我觉得没有什么大问题,不知道您具体是什么意思?-- [[User:Ran|ran(留言)]] 18:13 2004年10月24日 (UTC)
- 如果以传统中文作为储存的标地, 那辞对照表就可以百分百生效, 因为单向的转换(正体 -> 简体)是没有问题的.
- 其实还是不行,如:
- 了解 -> 了解
- 瞭望 -> 瞭望
- 虽然比简体转繁体要好得多,但是还会出问题。
- 其实还是不行,如:
- 可以用传统中文撰写条目, 不代表一定要会输入法. 当然, 要求去学, 是有些过分了.
- 文言撰写的文章, 符合三个条件, 以简体中文受教育的人来说是没有问题的:
- 1, 学生时代读过
- 2, 过去的作品
- 3, 内容中没有被简化的字
- 有些人可以用文言文撰写文章喔, 真的有把握可以看懂? 如果转成简体中文字? 试试这个
- 余云云乃水之所余, 不可触, 面化多端, 近人居谓之烟, 绕峰严语之岚, 昏滞霄名之霞. 及冷聚, 不能浮而成落水. 再进大地. 属天行矣.
- 落水三日, 漫居. 水去三日大曝, 余氏园中枝腐干干. 仅余泥数石.
这点我可以保证:至少就本人来说是没太大问题的。 老实说,这纯粹是语言习惯的问题,大陆用简体字不代表大陆不用教古文——打个比方好了,无论一个外国人说的中国话如何糟糕,一般都能听懂七八成的(何况简繁对应是有规律的)。 实际上拿出一篇繁体文章来,对本人来说并无太大障碍——并非本人真的认识繁体,只不过习惯中文,半猜半读而已--zhouxiao 10:32 2004年12月7日 (UTC)
忘记签名 --西贝山人 19:22 2004年10月24日 (UTC)
拜托别再搞这简繁合并的计划,这是不可能完成的任务。台湾和中国的文字和语言分歧已经太大,人民的思维也不一样。 --彰化人
在维持条目中立的情况下,支持简繁合并编辑。 在尚未寻找出完美的简繁互转方案前,只能先希望使用繁体的华人在阅读时能够尽量协助注意条目有无错误, 例如我发现民初名人严復,由于是用简体字编辑,復原的“復”(彳复),其简体的“复”字转成繁体会变成重複的“複”(衣复)字;另外一些姓余的人,在繁体界面看到的全变成了姓“餘”(食余)。 在有好的解决方案前,要解决这些比较明显的问题,可能得请繁体使用者将原文贴至word作取代, 再贴回原来的内容;至于条目标题,就需要使用“移动”选项重新命名了。
--Wikimania 12:18 2005年1月6日 (UTC) Abel Cheung 22:10 2005年4月15日 (UTC)
又或者,像我更改上面几行的讨论所用的方法,如果肯定转换有问题时,直接用 HTML entity 来避免转换。例如:
HTML entity | 表示 |
---|---|
余 | 余 |
餘 | 餘 |
这种方法显示绝不应转换的字。不过这种方法需要有将中文字转成 HTML entity 的工具才能使用。 Abel Cheung 22:17 2005年4月15日 (UTC)
繁简合站与分站的优劣
邮件列表上 Stirling Newberry 明确地在这里比较了繁简合站与分站的优劣:
The advantage of a technical fix to the character problem to have one version is that the problems don't grow with time, where as diverged versions do. The problem set of making two characters sets work isn't a fast moving target, where as keeping up with two sets of wikipedians is.
翻译过来大意就是:繁简统一在一个网站中对繁简字符进行转换,程序员的工作量是不随时间增长的;反之,繁简分在两个网站后再想统一它们,要作的工作量就是随时间增长的了。作两个字符集转换的工作是一个固定的目标,而在两个分开的网站间转换就是不断变动的目标了。
这个对比很清楚。一旦分站再想合代价就会很大。--Mountain(Talk) 10:32 2004年9月11日 (UTC)
同名不同意
有些词汇在繁简体中或不同地区中可能同样一个词汇,具有不同的含义。例如中国大陆称非洲一个国家为突尼斯,其首都也叫突尼斯,而台湾则国家称做突尼斯,首都叫突尼斯。像类似这种问题我们如何处理呢?--百无一用是书生 (Talk) 06:51 2004年9月14日 (UTC)
像上面的情况,同一条目包含两块内容如何--冷玉 07:29 2004年9月14日 (UTC)
还是:
国家条目放到突尼斯 (国家)(简)或突尼斯(繁),然后另一条目成重定向。 城市条目放到突尼斯 (城市)(简)或突尼斯(繁),然后另一条目成重定向。
重要的是在文中说明各地称呼不同。 --Lorenzarius 08:09 2004年9月14日 (UTC)
- 明白。那末就把突尼斯变成消歧义页。然后突尼斯 (国家)自动转换成突尼斯。 --Lorenzarius 08:34 2004年9月14日 (UTC)
- 关于突尼斯的问题比较特殊点,我强烈地怀疑将该国翻译为突尼斯其实是官方标准翻译错误(因为没有看过哪种语言里面,是将这个国家发为接近“突尼斯”的音),类似的状况有点像是以前台湾这头正式的参考书将美加边境的Niagara Falls翻译为“尼加拉瓜大瀑布”,但事实上,尼加拉瓜是中美洲的一个国家,两者根本没关系也不知为何会翻成那个音。后来不知曾几何时教科书已经偷偷地改为“尼加拉大瀑布”,很显然终于有人发现到官方标准也翻错了......--泅水大象 08:42 2004年9月14日 (UTC)
- 建议引入“#简繁/突尼斯/突尼斯#”之类的机制。目前的简繁转换已经能够处理大多数情形,但例外情况都让转换工具去做并不现实。
- 上面的问题应归结为“#简繁/突尼斯(国家)/突尼斯#”、“#简繁/突尼斯(城市)/突尼斯#”,没有注释的简体“突尼斯”不能确认对应哪一个。另外我说的是一种补充机制(以前也有人提过这样的想法),所谓有备无患:)--冷玉 09:25 2004年9月14日 (UTC)
同文堂繁简转换程式
同文堂可用于Mozilla Firebox但非Internet Explorer作繁简转换,但还不会换词,只会换字,也不会换有时要换但有时不要换的字。例如:“标准”繁换简是“标准”,但“标准”简换繁却是“标准”,而“新西兰”和“新西兰”不会自动互换。虽然功能还不万能,但请大家试试看。
同文堂及其一切附件是以自由软件形式的 GNU 通用公共许可证第二版 (GPL) 发布的。 Jusjih (Talk) 09:11 2004年9月19日 (UTC)
可以参考此网站提供的简体繁体转换程式, http://artvinedata.com/images/uu2.htm, 没有“标准--标准--标准”的问题。 -- 2005/3/05
可以参考"新同文堂",可以在Fireofx1.0以上执行,不但可以简单正体简体转换,还可以用自定词汇表,或指定外部转换程式 http://forum.moztw.org/viewtopic.php?t=4359 PTC 13:18 2005年3月19日 (UTC)
不用参考"新同文堂"的词汇转换表,基本上"新同文堂"只得两位作者和讨论区网友校对词汇,所以词汇转换表不会比Wikipedia众人校对的转换表准确。passerbyhk
闽南语
能不能自动转换?--[[User:Zy26|zy26 (Talk)]] 20:46 2004年9月24日 (UTC)
- 我完全没有概念。那里有比较详细的介绍吗? -- Zhengzhu 21:14 2004年9月24日 (UTC)
- 有点不懂,闽南语需要转换成什么吗?--Jose Sun (伦伦) 11:45 2004年10月16日 (UTC)
- 应该满难的吧。那就像是把汉语拼音自动转成汉字,或是智能型输入法一样难啊。--密尔希弗拉雪 19:02 2004年10月24日 (UTC)
- 而且闽南话的语法也和北方话有相当大的出入...... -- [[User:Ran|ran(留言)]] 23:20 2004年10月24日 (UTC)
这个似乎离谱了点——要是全中国所有持不同方言的人都来作这类要求的,管理员必死无疑-_-b--zhouxiao 10:32 2004年12月30日 (UTC)
建议将zh-cn和zh-tw改成zh-sc和zh-tc
建议将连接中的zh-cn和zh-tw改成zh-sc和zh-tc
前面两个有强烈的地域暗示性,况且简体中文也不止在cn在用,繁体中文也不只是在tw在用,继续使用这两个名称将很容易造成中文版的分离。建议改成zh-sc和zh-tc,使简体中文和繁体中文的意思,请尽快着手修改,谢谢!
VipUser 15:55 2004年10月26日 (UTC)
ISO的标准不是zh-sc和zh-tc,而是zh-CHS和zh-CHT,要改也应该改成后者。 - Yaohua2000 16:21 2004年10月26日 (UTC)
但是我不能确定zh也不是ISO的标准,如果是的话那遵照好了,但这件事我觉得应该必须做,至于改成什么样子还是次要的.--VipUser 02:09 2004年10月27日 (UTC)
zh-cn zh-tw 均为事实标准, 应该也是iso标准, 无须多此一举别出心裁. 心在蛤蟆囤的果酱 02:53 2004年10月27日 (UTC)
请Jamguo解释一下别出心裁?你是否调查过是不是iso标准呢,我如果用zh-hk如何,按照你的说法,这是否也是事实标准呢?--VipUser 14:37 2004年10月27日 (UTC)
在IE的语言选择之中,确实是分成zh-tw(台湾)及zh-cn(中华人民共和国),此外还有zh-hk(香港)、zh-sg(新加坡)跟zh-mo(澳门),这也是目前我们在进行繁简体转换所使用的模式,让将来从不同地方上来的人可以选择语言,然后系统就可以自动进行繁简体转换,除非VipUser兄能请Microsoft这种语言分类给改掉,否则没有必要在这边过度联想它的地域暗示性,因为它本来就是要分辨不同地方上来的人,然后找到最适合的阅读方式而已。顺带一提,英文就有十几种分类。--[[User:Theodoranian|虎儿 (留言)]] 14:46 2004年10月27日 (UTC)
赞同虎兄不要过度联想的观点,但是从技术上还要进一步讨论。有的事情只要大家讨论才会有结果,我也会继续为维基努力的。--VipUser 15:27 2004年10月27日 (UTC)
- 传统上常常使用zh-cn/zh-tw的区别,不过这不是好的language-tage,IANA有定义新的tag, zh-hans/zh-hant (http://www.iana.org/assignments/lang-tags/zh-Hant, http://www.iana.org/assignments/lang-tags/zh-Hans) ,使用Hans,Hant 来区别繁体字和简体字,如果要区别地方语言差异(Language variant)则可以在加上 -cn, -tw,-hk,-sg,比如说 zh-hans-cn, zh-hant-tw, and zh-hans-sg, zh-hant-hk. IE/Microsoft Windows 常常使用自己的标准,不跟IANA,W3C走,这里建议还是尽量照 ISO/IANA 走Pektiong 15:51 2004年10月27日 (UTC)
zh 是 ISO 639 的语言代号,CN/HK/MO/SG/TW 是 ISO 3166 的地区代号,各位对于这方面还有没有怀疑的地方?还有两个问题:
- CHS 和 CHT 是哪个 ISO 标准?可以说出来吗?
- 哪个系统或者 browser 在用 zh-hans 和 zh-hant? 恕我见识浅薄,目然为止还未见过。
Abel Cheung 21:18 2005年4月15日 (UTC)
建议用繁体编辑所有关于中华民国及台湾的人、事、物的条目
中华民国自1912年成立以来,不论是以前统治中国大陆,还是现在统治台湾,一直以繁体中文为标准,虽然教育部曾在1935年公布《简化字表》。为了一贯性,建议用繁体编辑所有关于中华民国的人、事、物的条目,不论是以前统治中国大陆,还是现在统治台湾的时候,否则可能不连贯。即使不会写繁体,仍可先写简体,再繁体化。
这是我的看法,欢迎讨论。中国清代或以前的人、事、物的条目,用繁体或简体,欢迎编者自选。我偏好繁体,但也看得懂简体。Jusjih 09:16 2004年11月13日 (UTC)
- 我想以下的东西应用繁体字来写:香港、澳门、台湾所有事物、1949年前中国发生的所有事情;以下的东西应用简化字来写:中国内地(不包括港、澳、台)地理、1949年之后中国发生的所有事情、与年份或地区无关的事物(例如我要写文介绍什么叫收音机或什么叫氧气) Hello World! 09:58 2004年11月17日 (UTC)
- 我觉得这样并不可行。限制繁体或简体来编写某一条目,可能会带来不必要的关于中立性的争论;另一方面,关于同时涉及两岸三地的人、事、物又该如何处理呢? 目前的转换技术方案只考虑显示页面时使用的字体,其背后假设是,任何文章都可以用繁体和简体混合编写,在显示页面是由程序自动转换成单一的繁体或简体。加上必要时的手工转换标记,我觉得这个方案可以解决大多数连贯性问题。其缺点当然是在编辑文章时,作者仍需面对繁简混排的情况。但是这也可以最大限度地让更多人参与条目的写作。 -Zhengzhu 18:42 2004年11月17日 (UTC)
- 如果作者的编辑本章的时候,可以选择用简体或者繁体面对文章怎么样,程序在作者编辑之后应该会同样的自动转换。毕竟还是有用户不能容易的面对繁简混排。--[[User:Zy26|zy26 (Talk)]] 02:55 2004年11月18日 (UTC)
- 我同意可用电脑程序进行繁简体转换,使不同用户可使用他熟悉的繁体或简体文字来编写。我最关注的是条目名称的问题。就在最近,我便被一个“黄”字考起了。Unicode内同时有一个“黄”字(上部分是廿字加一划)及“黄”字(上部分是卄字加一划)。如不考虑条目名称应该用“黄”字或“黄”字,将会混乱到极。这里极可能有两篇文章,一篇叫“黄大仙”(香港地名),一篇叫“黄大仙”(道教神祇)。Hello World! 06:32 2004年11月18日 (UTC)
- 如果使用简体中文,应为“黄”,另外的视为异体。--[[User:Zy26|zy26 (Talk)]] 12:12 2004年11月18日 (UTC)
- 但香港地名的文章多数会用繁体字写的,这就是出现我上述说会撞名的原因。有没有解决方法? Hello World! 16:33 2004年11月18日 (UTC)
- 同中国和中国解决方式一样。--[[User:Zy26|zy26 (Talk)]] 16:50 2004年11月18日 (UTC)
- 两个条目的三个字都一样,但是有不同意思。现在我于黄大仙一条放了消歧义字样,把道教黄大仙连往他的原名黄初平。Hello World! 00:44 2004年11月19日 (UTC)
- 同中国和中国解决方式一样。--[[User:Zy26|zy26 (Talk)]] 16:50 2004年11月18日 (UTC)
- 但香港地名的文章多数会用繁体字写的,这就是出现我上述说会撞名的原因。有没有解决方法? Hello World! 16:33 2004年11月18日 (UTC)
- 如果使用简体中文,应为“黄”,另外的视为异体。--[[User:Zy26|zy26 (Talk)]] 12:12 2004年11月18日 (UTC)
- 我同意可用电脑程序进行繁简体转换,使不同用户可使用他熟悉的繁体或简体文字来编写。我最关注的是条目名称的问题。就在最近,我便被一个“黄”字考起了。Unicode内同时有一个“黄”字(上部分是廿字加一划)及“黄”字(上部分是卄字加一划)。如不考虑条目名称应该用“黄”字或“黄”字,将会混乱到极。这里极可能有两篇文章,一篇叫“黄大仙”(香港地名),一篇叫“黄大仙”(道教神祇)。Hello World! 06:32 2004年11月18日 (UTC)
- 我早放弃了,现在我不管是舍文章,我都以繁体字编辑。--Wshun 00:52 2004年11月18日 (UTC)
- 用自己习惯的方式,程序做剩下的,应该不错。--[[User:Zy26|zy26 (Talk)]] 12:12 2004年11月18日 (UTC)
其他计划的繁简体问题
我们是否也应该同样方式合并其他计划中的繁简体页面?例如维基资源等?--百无一用是书生 (☎) 13:14 2004年11月22日 (UTC)
- 如果程序能保证同现在一样的方便的话。--[[User:Zy26|zy26 (Talk)]] 13:41 2004年11月22日 (UTC)
希望有保持页面原样的选项
其实,我相信很多人和我一样,对于简繁体的阅读都不存在太大问题的 现在一律转成一种的话,阅读上反倒出问题了——比如那段关于“台湾”二字的简繁体问题的讨论,现在根本就没法看了……--zhouxiao 10:32 2004年12月30日 (UTC)
- 试过了“不转换”了吗?XD--密尔希弗拉雪 03:49 2004年12月31日 (UTC)(另外,帮您把行首输入的“;”改掉啰,如果要缩排的话应用“:”才是!:))
- 或者在个人选项里将字体设为“zh”。-Zhengzhu 04:18 2004年12月31日 (UTC)
- 多谢两位,现在没问题了
- 另外,关于“;”,其实我一开始也不是为了缩排啦——主要是,不加符号的话,在显示时“硬回车”是无效的,因为也不知道别的方法,暂时用它当回车起始符号了^_^Zhouxiao 09:51 2005年1月3日 (UTC)
早就已经停止编辑的http://closed-zh-tw.wikipedia.org
http://closed-zh-tw.wikipedia.org 是主张繁体版独立的维基百科,但早就已经停止编辑,仅能查看源文件。
本维基百科中文版的繁简条目几乎完成合并。也许closed-zh-tw所有的内容这已都有了(希望如此)。见http://mail.wikipedia.org/pipermail/wikipedia-l/2004-September/016933.html
转换范围
繁简转换的范围应该有一个限制,比如繁简体用语相差很大,双方很难了解的词,以及翻检转换出错的词。至于日常用语,如果不妨碍理解,应该尽量不转换。我们的目标应该是尽量不转换,而不是有一点差异就转换。汉语还在一直发展,两岸三地的交流也使这些差异在减小--百無一用是書生 (☎) 07:16 2005年1月18日 (UTC)
反对正体转换
请到 wikibook 中文去看一看 论语。
诗云的正体不能是诗云! 真不知所谓! 请大家对繁简的问题看得深入些, 想透一些. 某些文字, 如名字, 法律条文等, 是不允许自动转换的。如果你真的看不懂, 从正体用机器转到简体是可以接受的。但用机器自动转成正体, 就不是那么简单的啦.
虽然, 目前仍留了不转换的一种选择, 但一日这正体的自动转换存在, 我们就没法保证我们写的对的东西会自动变成不对的东西。
大家都很热心, 对技术抱有很大的希望, 想利用技术来解决问题. 这非常好. 但请尊重语言的多样性和复杂性. 请不要夸大技术的能力, 让机器做一些它不能做的.
- 这个我们已经考虑到了,只需在文章顶部加上__NOCC__标记,就可以禁止对该文章进行任何转换。参见Wikipedia:繁简处理-Zhengzhu 20:46 2005年3月19日 (UTC)
因为不知道大家看不看wikisource的讨论页,我还是在这里提出好了:
大家觉不觉得,wikisource根本就不应该进行自动的繁简转换?尤其是像古文、诗词这类的东西,用电脑进行正确的转换简直就是不可能,还不如把繁简版本分开。而且这些古代的原文都只有一个版本,不会有多少人去反复编辑,所以不会出现不同步的问题。-- ran(留言) 21:00 2005年3月19日 (UTC)