跳转到内容

维基百科讨论:机器人/提议

页面内容不支持其他语言。
维基百科,自由的百科全书

建議運行機械人大量創建條目

[编辑]

近日,加泰羅尼亞語版維基百科運用機械人大量創建條目,結果中文版與加泰羅尼亞語版的條目差距八天內由35993條急28119條,並正繼續下降。有見及此:

  • 建議運行機械人,大量創建百科條目,以使加泰羅尼亞語版不會超越中文版的內容
  • 建議想想如何可以提高條目數量

希望各位給些意見,我不想見到中文版降至第十三位。-HW留言 - 貢獻2011年4月5日 (二) 07:07 (UTC)[回复]

排名都是空虛的,降至13位不代表什麼,為了這個大量製造機器條目很不好。--Reke (留言) 2011年4月5日 (二) 07:11 (UTC)[回复]
我也支持重質不重量,若是靠機器人憑空創了一堆無實質內容的條目只是為了搶排名,實在沒什麼意義。-TW-mmm333k (留言) 2011年4月5日 (二) 07:17 (UTC)[回复]
(?)疑問机器人创建的条目是ctrl+c和ctrl+v模式吗?--Noah~~ (留言) 2011年4月5日 (二) 07:21 (UTC)[回复]
(:)回應不是,看Special:用户贡献/Dingar-bot。-HW留言 - 貢獻2011年4月5日 (二) 07:23 (UTC)[回复]
好像不错,但是这些数据不也是人工输入的吗,会不会反而加大了工作量?--Noah~~ (留言) 2011年4月5日 (二) 07:54 (UTC)[回复]
单这样看机器人创建的条目也还过得去啊。不知资料来源在哪里?加上就行了。—Snorri (留言) 2011年4月5日 (二) 07:56 (UTC)[回复]
如果是机器人建立的,希望加refimprove和expand模板。--爱管闲事的Inspector六方会谈核试验2011年4月5日 (二) 08:34 (UTC)[回复]
一點都過不去啊,都是瑣碎資料的羅列,當要擴建此一條目的時候搞不好還要去整理這些資料。而且對讀者的意義也不大。我寧願看到那個地名條目沒有羅列一堆區,可是用100字內告訴我它在哪裡、有多大、有多少人口,大部分人在做什麼。--Reke (留言) 2011年4月5日 (二) 11:12 (UTC)[回复]
数据都没有,创建个啥。--菲菇维基食用菌协会 2011年4月5日 (二) 08:47 (UTC)[回复]
User:Dingar-bot。我打算委託這位用戶創建一些香港街道的條目,初步自己認為收錄標準為在Google有10,000個結果以上的街道(例子:黃大仙道)。-HW留言 - 貢獻2011年4月5日 (二) 09:58 (UTC)[回复]
个人感觉“google10000个”不太科学,Google趋势10000更容易扩大社群燃玉 (留言) 2011年4月30日 (六) 11:49 (UTC)[回复]
避免{{fame}}及{{substub}}。--UAL55 (留言) 2011年4月5日 (二) 11:17 (UTC)[回复]
如果方针已经开路支持的话最好。--爱管闲事的Inspector六方会谈核试验2011年4月5日 (二) 11:22 (UTC)[回复]
美国的市镇条目还有几万条白着的,这些条目的重要性总要高于一个城市的街道吧?--菲菇维基食用菌协会 2011年4月5日 (二) 12:52 (UTC)[回复]
(!)意見,建立整數數字類條目吧,數據由機械人運算出來。冰霜葵 2011年4月5日 (二) 12:59 (UTC)[回复]
利用机器人建立那些请求条目页的红链?如果保证条目质量或资料来源的话,我倒是挺支持的。--Anilro (留言) 2011年4月5日 (二) 12:03 (UTC)[回复]

(!)意見。超越了又怎麼樣?是見不得別人的名次高嗎?名次高一點的意義是什麼?如果說名次高一點,儲存空間多一點,運行快一點,或者是經費多一點,那就大家一起寫機器人。如果和這些實質的事情一點關係都沒有,提出這種事情想要達到的目的又說不出一個更有意義的,先想清楚再提出吧。要Think Through。-cobrachen (留言) 2011年4月5日 (二) 12:17 (UTC)[回复]

如果能够吸引更多的人关注中文维基,进而扩大社群人数,提高编辑活跃性,这也不失为一个好的方式。--菲菇维基食用菌协会 2011年4月5日 (二) 13:03 (UTC)[回复]
應該不會有這種效果,除了社群內之外,不太會有人關心中文維基百科排名多少,也不太可能因為排名很好就很來編輯。倒是排名很爛搞不好還會出現像HW這種,除了有維基意識還有危機意識的熱血人會為了排名來號召衝條目數。--Reke (留言) 2011年4月5日 (二) 13:46 (UTC)[回复]
我倒想知道這些機械人如何量產......(速度真的很快嗎?容易使用嗎?如果要花時間整理出那些data文件給機械人,手動創建可能比機械還快,也可以多補一點內容)其實只要條目愈多,網絡上搜尋到的機會就愈大。為排名就免了,但為增加條目我想是可以的,只是內容還要再詳議。美國很多的地區行政規劃,中文維基已經等了幾年都沒有創建,當中不乏一些重要城市......有些時候,只要有最最最基本的資料,也總比幾年過去還是紅字好。我記得很久很久前某次動員令,是有人量產美國的行政規劃的,但近來又好像不見了。至於參與者的問題,還是看上面社群所見即所得等等的討論吧。Oneam 01:00 AM (留言) 2011年4月5日 (二) 14:47 (UTC)[回复]
(:)回應,我想,现在的问题是没有壳,质量很高的也很少。--Cscen ◎留言板 2011年4月23日 (六) 01:03 (UTC)[回复]
  • 我覺得機器人條目若真的要實行,應該設計模板,內容訊息明確揭示。因為不這麼做,有的新手參考這樣的寫法去寫條目,很不好。(變成不敘述,只用資料堆砌,也只有最初步的訊息而不深入。最糟糕是不列明來源)文字內容可以如下:
    「這是一個經由機器人自動生成的條目,限於技術僅能添加最基礎的信息供初步參考。如您想創作同類型條目,請參考更好的作品,或是將本條目添加敘述性的內容。」--Reke (留言) 2011年4月6日 (三) 00:45 (UTC)[回复]
  • (+)支持如果对机器人不信任,可以审核它创建的内容。人类去写那些需要用机器人创建的条目,不见得会有什么不同。另外我在想机器人能不能在Google上搜集资料,搜索并自动添加例如XX镇,面积XX平方公里,户籍人口XX人,流动人口XX人等基本信息。这样更好。--Caiguanhao (留言) 2011年4月6日 (三) 02:29 (UTC)[回复]

请HW先列出之前应用此机器人大量创建的条目先例,再由维基人评估是否应该启动机器人。支持者有支持者的理由,但反对者的意见(主要是条目质量)也不容忽视。-Edouardlicn (留言) 2011年4月6日 (三) 11:05 (UTC)[回复]

User:Dingar-bot之貢獻-HW留言 - 貢獻2011年4月6日 (三) 11:43 (UTC)[回复]
  • (!)意見:使用機械人大量建立條目是很多語言版本維基百科行之已久的措施。以前中文維基未有這樣做,主要原因並非大眾不支持,而是因為技術上的問題——難以找到讓機械人使用的資料庫。如果技術上沒有問題,應該盡快進行。--沙田友 (留言) 2011年4月6日 (三) 14:31 (UTC)[回复]
  • (+)支持,有竞争才有动力。--玖巧仔留言 2011年4月6日 (三) 16:45 (UTC)[回复]
  • 强烈(-)反对:有嘛用啊?!如果要得到基本信息,维基自带的搜索系统完全可以引导用户至相应的内容。那个Katalan什么的,它想超就让它超去吧。—以上未簽名的留言由虞海對話貢獻)加入。 2011年4月6日 (三) 17:03 (UTC)[回复]
  • (-)反对,不是别人做了我们就该做,不是别人做的,我们就该学。数量和排名终究能代表什么...没有质量的前提,让我想到了大跃进还是浮夸风..--AddisWang (留言) 2011年4月7日 (四) 07:04 (UTC)[回复]
  • (+)支持,但条目的关注度不应该存在争议。小至街道的行政区划经常列入存废讨论,因此不宜用机器人大量创建。-iamchenzetianTalk:iamchenzetian 2011年4月7日 (四) 09:26 (UTC)[回复]
  • (*)提醒我澄清一下,让机器人创建条目来填补那些小地方小街道等繁杂的工作我(+)支持,但是如果用机器人创建条目的目的是为了让条目数大幅增加我极力(-)反对--Noah~~ (留言) 2011年4月7日 (四) 09:36 (UTC)[回复]
  • (+)支持,這些條目也是有價值的,但內容應增加(如面積、人口等應是基本的)。--靖天子~北伐抗戰軍統局/請加入生物學提升計畫 2011年4月7日 (四) 11:41 (UTC)[回复]
  • 建立什么条目?数据怎么得到?数据的版权问题怎么解决?这都没说清楚就支持反对有什么意义?--达师198336 2011年4月7日 (四) 13:08 (UTC)[回复]
  • (-)反对惡性競爭必定兩敗俱傷。-- 小虎 Tiger 不入虎穴,焉得虎子 2011年4月7日 (四) 13:59 (UTC)[回复]
  • (!)意見:不明白為何這些小事都要搞投票。維基百科從來沒有方針規定條目必須由真人建立。只要條目的水平合格,不會被人因格式問題或內容過短等原因而被提刪,是真人還是機械人建立又有甚麼所謂呢?以前做這種事根本不需要徵求社群同意,印象中也未有因此而出過亂子。 -- Kevinhksouth (Talk) 2011年4月7日 (四) 15:07 (UTC)[回复]
  • (+)支持,如果有数据我很支持。但最好是重要性低的街道类条目,那些即使是人工创建质量也不会强多少。--Cscen ◎留言板 2011年4月8日 (五) 05:00 (UTC)[回复]
  • (-)反对--讓機器人量產條目僅僅為和人比較條目總數?請問有甚麼意義?還不用說質量甚麼的問題,又說一些小街道,看了那些所謂內容,其實也沒甚麼得著,有必要嗎?街道有實際的歷史背景或特色,並於條目內介紹,看起來才有意義,純粹鋪陳街道地理資訊,我還不如去看地圖。純以機器人出數字等條目沒有不妥,只是覺得數字條目有點「食之無味,棄之可惜」。--Eartheater (留言) 2011年4月9日 (六) 10:51 (UTC)[回复]
  • (!)意見,如果條目內容是大同小異,例如上述提出的街道條目等等,在下認為使用機械人來創建條目,可以節省人力,同時增加中文維基的條目數量,如其要大家不斷重覆相同的動作,倒不如讓機械人大顯身手。條目數量增加並不單單為了與其他語種的維基百科競爭,更重要的目的是讓讀者可以知道更多,了解更廣,只要有益於讀者,由機械人還是真人創建又有什麼關係?—ATRTC 2011年4月9日 (六) 16:32 (UTC)[回复]
  • (&)建議[1][2][3][4]存有大量明星、电影、电视剧和音乐的数据。如果把这些全部创建,可使中文维基百科的条目数量增加五万左右。大家想不想摆脱加泰罗尼亚语的追赶?大家希望不希望超过瑞典语维基百科,使条目数量排名升至第11位?想的话,就马上行动,用机器人或不用机器人都可以,赶快创建这些条目吧!--Symplectopedia (留言) 2011年4月9日 (六) 22:41 (UTC)[回复]
  • (!)意見:机器人最好还是慎用,由于一些条目的译名不同可能会造成条目重复、侵权或覆盖的问题,包括重定向。这样不必要的垃圾条目也会日益增加,这或许更增加了维基人每天清理或巡查的工作量。还有条目中没有进行分拆的内容也会新建出一个条目等因素。用机器人建立条目可能会违反维基百科的方针,机器人也不是万能的,希望大家更多的不要依赖机器人,不要为了追赶超越而利用机器人把维基百科搞得严重崩溃。--Anilro (留言) 2011年4月10日 (日) 05:16 (UTC)[回复]
  • (!)意見,是否有可能規劃出某個機器人能創建的範圍?意即機器人只能生產或修改某一類型的條目,比方說更新元素名稱列表或是質數列表這類的工作。──Xxx83221 (留言) 2011年4月10日 (日) 08:48 (UTC)[回复]
  • (+)支持,如果能藉由增加可達最低標準的新條目,應該有助於提升維基百科在搜尋引擎中的曝光率,未嘗不是一件壞事。--Alexchris (留言) 2011年4月10日 (日) 09:23 (UTC)[回复]
  • (:)回應,我不知道 Kevinhksouth 是不是在說我的(+)支持,讓大家感覺像是投票,不管是不是我以後會謹慎使用,但是由機器人幫忙提升條目,我是不鼓勵但是也不反對,畢竟機器人也有出過一些亂子(合格條目提報為侵權條目,過了好久才有人發現)。--Honmingjun--銘均 2011年4月12日 (二) 10:57 (UTC)[回复]
(-)反对打倒機器人—北極企鵝觀賞團 (留言) 2011年4月13日 (三) 03:41 (UTC)[回复]

参考meta:Mass content adding--百無一用是書生 () 2011年4月20日 (三) 12:31 (UTC)[回复]

(!)意見,就是,我觉得连续创建地理条目最累人的就是总会出现相似的东西,感觉自己就像bot一样了 囧rz...--Cscen ◎留言板 2011年4月23日 (六) 01:03 (UTC)[回复]
(!)意見--我想请HW回答一个问题,能否理出一些或者一类条目,这些条目让机器人进行编写和写作后条目的可读性不会降低,而可以减免许多人工的。比如有些条目仅仅为大量名词的叠加或者表格和数字的。若能够让机器人编写这种繁琐且无味的条目,让更多人力投入在其他较难编写的条目上,既提高条目数量又不会降低质量,则在下大力支持!Merphisto (留言) 2011年5月3日 (二) 05:21 (UTC)[回复]
  • (+)支持 对于新条目而言,有一点微薄的基础总要比从零开始来的好。扩充一条哪怕是仅符合最低要求的条目也要比创建一条新条目容易很多。为了中文维基百科的繁荣昌盛,我支持这一提议。--lavix canvas (留言) 2011年5月3日 (二) 17:17 (UTC)[回复]
我覺得名次是其次,但能有辦法大量增加有起碼內容的條目也是很好的,也可多吸引一些人來中文維基百科。(經由搜尋引擎,有時候只有些基本內容其實就對網上找資料的人有幫助了)事實上,不說加泰隆尼亞語版,就我所知,排在我們前面的11個維基百科版本中的機器人條目大多都比中文要多不少。(只有瑞典語版我不熟悉,日語版不確定,其他應該都多於中文版,有些版本機器人條目可能多於10萬條)我們完全沒必要排斥機器人條目。ffaarr (talk) 2011年5月4日 (三) 10:55 (UTC)[回复]

參考WolframAlpha

[编辑]

看了一下那個機器人創建的内容,我認爲可以對比一下Wolfram AlphaWolfram Alpha代表著機器人搜集信息的最高水平,我認爲維基百科的機器人創建的條目,有如下兩個特點:

  1. 加大了信息的冗餘度,花費了服務器的資源卻沒有達到花費這些資源所應達到的效果(和WA相比);
  2. 職能程度有限:需要獲得這些信息的讀者,完全可以通過Wolfram Alpha獲得類似的信息——這意味著我們在做一件別人已經做完的事。

所以我認爲,大量使用機器人創建條目是無用的。具體的情況(如行政區劃)可以針對具體情況逐一討論通過,但大口子不宜開。 —以上未簽名的留言由虞海對話貢獻)加入。 2011年4月7日 (四) 15:43 (UTC)[回复]

—以上未簽名的留言由虞海對話貢獻)加入。 2011年4月7日 (四) 15:48 (UTC)[回复]

囧rz...刚知道有这个网站,那个不是万能的吧,就搜索容桂。输入中文时出现:Wolfram|Alpha 不支持中文。Wolfram|Alpha does not yet support Chinese.;输入中文的拼音Ronggui就跳到印尼的Rongga。更不用说其他偏远山区的地名吧。--Caiguanhao (留言) 2011年4月8日 (五) 03:21 (UTC)[回复]
(:)回應:我是說WA的運算手段是先進的,不代表它的數據先進。事實上,WA連中國的縣級行政區都沒有覆蓋完全。但是,使用機器人創建的條目肯定沒有“逐項對比”的功能(未來也不可能有),而WA做到了。也就是說,人家已經把機器人的最高水平封頂了,再做基於文本的也沒什麽意思。—以上未簽名的留言由虞海對話貢獻)加入。 2011年4月9日 (六) 07:22 (UTC)[回复]
如果可能,我認爲可以向MetaWiki申請一個“維基數據庫”項目,縂比在這裡用機器人建條目好。這樣很多不符合WP:IINFO的也可以錄入進去,包括什麽公交查詢、車次查詢之類的雜七雜八,全都可以整合進來。—以上未簽名的留言由虞海對話貢獻)加入。 2011年4月9日 (六) 07:18 (UTC)[回复]
(!)意見,可能会有很大的来源单一的问题。--爱管闲事的Inspector六方会谈核试验2011年4月8日 (五) 10:06 (UTC)[回复]
(-)反对,就怕生出一些文意不通的中文。--俠刀行 (留言) 2011年4月8日 (五) 10:25 (UTC)[回复]
  • (:)回應感谢大家对我那个粗糙代码的关心。Dingar-bot只是为了方便我自己编辑的一个文本替换工具,没有任何智能。所有数据均手工整理。希望有高手开发出真正的机器人。--Dingar (留言) 2011年4月8日 (五) 15:55 (UTC)[回复]
  1. (+)支持,但建議注明此頁面是由機械人撰寫,需要維基人作質量檢測和修正內容。-張子房 (煮酒論英雄) 2011年4月13日 (三) 06:54 (UTC)[回复]
  2. (=)中立一個很矛盾的問題,因為會造成麻煩。--Flame 歡迎泡茶 2011年4月19日 (二) 15:33 (UTC)[回复]
(!)意見--我想请HW回答一个问题,能否理出一些或者一类条目,这些条目让机器人进行编写和写作后条目的可读性不会降低,而可以减免许多人工的。比如有些条目仅仅为大量名词的叠加或者表格和数字的。若能够让机器人编写这种繁琐且无味的条目,让更多人力投入在其他较难编写的条目上,既提高条目数量又不会降低质量,则在下大力支持!Merphisto (留言) 2011年5月3日 (二) 05:21 (UTC)[回复]

我的建议

[编辑]

[5][6][7][8]存有大量明星、电影、电视剧和音乐的数据。如果把这些全部创建,可使中文维基百科的条目数量增加五万左右。大家想不想摆脱加泰罗尼亚语的追赶?大家希望不希望超过瑞典语维基百科,使条目数量排名升至第11位?想的话,就马上行动,用机器人或不用机器人都可以,赶快创建这些条目吧!--Symplectopedia (留言) 2011年4月9日 (六) 22:40 (UTC)[回复]

巴哈古丽HW留言 - 貢獻2011年4月10日 (日) 00:44 (UTC)[回复]
總算是有來源標示,但缺少小作品模板,分類上也可再加強。--安可(居住地:酒館-職業:詩與歌之演者)/請加入條目質量提升計劃 2011年4月12日 (二) 16:46 (UTC)[回复]
可以组织一个机器人编纂小组,机器人负责创建条目,小组成员负责检查并维基化...--AddisWang (留言) 2011年4月14日 (四) 09:41 (UTC)[回复]
或者能否有这样一种机制,让机器人创建条目,但是并不发表,由维基人检查后再通过并发表。有点类似于巡查员的角色,这样对于一些数据类条目肯定能提升不少速度,也不会出现上面担心的问题。--人神之间摆哈龙门阵 2011年4月15日 (五) 06:48 (UTC)[回复]
+1--AddisWang (留言) 2011年4月17日 (日) 04:52 (UTC)[回复]
支持人神之間的提議。--靖天子~北伐抗戰軍統局/請加入生物學提升計畫 2011年4月17日 (日) 11:46 (UTC)[回复]


wjcdbot

[编辑]

这是在wikt:建立大量页面的先例,贡献次数多达1138976次。没有bot,维基词典词条不会超过1000000个。--UAL55 (留言) 2011年4月11日 (一) 11:28 (UTC) ?=== 中文維基百科:世界第一 ===[回复]

  1. 在中國大路架設新服務器
  2. 把百度百科、互動百科的每一個條目,經過適當改寫後,在不侵犯版權的前提下,通通收錄進去。
  3. 中文維基百科世界第一,不再是夢想,把前11名的語言版本給超掉。
海納百川,有容乃大
人人可編輯的自由百科全書
已有5,214,221篇中文條目

TRA&HSR&BUS&MRT&LRT (留言) 2011年4月19日 (二) 00:04 (UTC)[回复]

(:)回應:百度百科是CC-by-NC-SA的,可以被抄到安那其百科。—以上未簽名的留言由虞海對話貢獻)加入。 2011年4月19日 (二) 17:01 (UTC)[回复]
不妨一次性抄百度百科到安那其百科,然後重新整理安那其百科。另外,中文維基百科若改在中國大陸架設伺服器,則需分離版本(如正簡分離)。很多現存條目的撰寫在中國大陸屬於罪行,如「洩漏國家機密」,「危害國家安全」或是「顛覆國家政權」等。61.201.49.129 (留言) 2011年4月21日 (四) 18:59 (UTC)[回复]
百度不是CC。他的版权条款中那一条什么CC什么GFDL全都是括号里的,去掉括号剩下“百度百科的用户在百度百科上发布的内容引用自CC协议,或GFDL协议保护的作品的,应分别按照上述协议的规定,合理使用他人作品。”←这一句版权归百度所有。--达师198336 2011年4月23日 (六) 08:54 (UTC)[回复]

(:)回應:很有意思的想法,不过维基人太少,就算是转化也要很长时间吧。还有,这不就和百度一样拙劣了吗?--Alzbla | Wikipedia the free Utopia!| 2011年4月23日 (六) 14:48 (UTC)[回复]

我该用什么表情,233吗?编写条目从我做起,不要只做一个空想家。--SyaNHs 2011年4月24日 (日) 05:46 (UTC)[回复]

是否需要让机器人自动给挂了模板的条目巡查?

[编辑]

英文维基有个机器人,在条目挂了速删、提删、侵权模板时自动标记已巡查。参见en:Wikipedia:Bots/Requests for approval/DASHBot 4。--MakecatTalk 2011年12月2日 (五) 14:10 (UTC)[回复]

這個挺好的,建議引入。—AT 2011年12月3日 (六) 02:17 (UTC)[回复]
(+)支持:最后还是要由管理员看一遍条目的,不用担心误判什么的。--铁铁的火大了20.00000000000 words 2011年12月4日 (日) 10:19 (UTC)[回复]

因為Wikipedia:机器人/提议較少人使用,大部分的人都是到Wikipedia:机器人/作业请求提出請求,而且兩者的功能「機器人實現的功能建議」和「請求機器人幫助作業」其實沒有很大差異,也時常有人到作业请求提出新機器人提議,因此建議全部合併到Wikipedia:机器人/作业请求,也方便有意關注的人集中到同一位置。

已經將過久的提案存檔,部分移動到作業請求,若無人異議的話將在提議頁掛上{{Historical}}並增加引導至作業請求的提示訊息。--Xiplus#Talk 2018年2月19日 (一) 07:56 (UTC)[回复]

同意本提案,精省頁面。--Temp3600留言2018年2月22日 (四) 18:14 (UTC)[回复]
(+)支持本提案:可以記少一个专案页面了。— 2018年2月23日 (五) 11:05 (UTC)[回复]
(+)支持:可以直接存檔到機器人之討論頁面--Z7504非常建議必要時多關注評選留言2018年3月5日 (一) 06:26 (UTC)[回复]