維基百科:機械人/申請/Cewbot/11

Cewbot 11

本次申請為d:WD:Requests_for_permissions/Bot/Cewbot之附屬功能。Kanashimi留言2016年4月15日 (五) 12:06 (UTC)[回覆]

 測試編輯?這個好像就是Antigng-bot/3 + Liangent-bot的感覺?--Jimmy Xu 2016年4月15日 (五) 17:24 (UTC)[回覆]
主要集中在 [[:l:t|T]]轉成[[T]]。先測試了一點點Kanashimi留言2016年4月17日 (日) 14:54 (UTC)[回覆]
不贊成直接把連結文本替換成條目名。--Jimmy Xu 2016年4月17日 (日) 17:34 (UTC)[回覆]
現在採:
  • [[:en:Day|地球日]] → [​[日|地球日]]
  • [[:en:Day (disambiguation)]] → [​[日 (消歧義)|日]]
  • [[:en:Day (disambiguation)|日]] → [​[日 (消歧義)|日]]
  • [[:en:Day (disambiguation)|Day]] → [​[日 (消歧義)|日]]
  • [[:en:Day]] → [​[日]]
  • [[:en:Day|日]] → [​[日]]
  • [[:en:Day|Day]] → [​[日]]
  • [[:en:First Last|First]] → [​[中文全名]]
  • [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [​[中文全名]] (譯名已匯入 wikidata aliases)

您的意見如何?--Kanashimi留言2016年4月18日 (一) 10:50 (UTC)[回覆]

一般說來,有機物分子在中紅外區有着強烈的吸收,因而紅外線具有明顯的熱效應。--Antigng留言2016年4月18日 (一) 13:21 (UTC)[回覆]
我總覺得這是錯用了,應該改的是原文本...這種情況下有正當使用的例子嗎?Kanashimi留言2016年4月18日 (一) 13:30 (UTC)[回覆]
所以不能錯上加錯。--Antigng留言2016年4月18日 (一) 13:32 (UTC)[回覆]
不如加上個偵錯功能Kanashimi留言2016年4月18日 (一) 13:34 (UTC)[回覆]
舉個例子,明武宗「但是也有人認為武宗追求個性解放,剛毅果斷,彈指之間誅劉瑾,平安化王、寧王之叛應州大敗小王子,是極具個性色彩的皇帝。」如果後面兩個連結是跨語言的,就不能轉成中文全名。--Antigng留言2016年4月18日 (一) 13:37 (UTC)[回覆]
改成於應州大捷大敗達延汗? 或者
  • [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [​[中文全名|無論是什麼奇怪譯名]]

...? 只是我想奇怪譯名的情況會遠多於特殊狀況...Kanashimi留言2016年4月18日 (一) 13:58 (UTC)[回覆]

@Kanashimi測試了一點點 的想辦法過濾出來,現在根本看不出測試了什麼。Liangent留言 2016年4月18日 (一) 18:00 (UTC)[回覆]

已測試。煩請看看有何需要改進之處。Kanashimi留言2016年4月21日 (四) 09:22 (UTC)[回覆]
[1])隨便點開就看到一個不恰當的……[2]Liangent留言 2016年4月22日 (五) 04:18 (UTC)[回覆]
有很多類似的[[中文名]],原名/简称/英文/缩写为[[:en:XXX|XXX]],感覺這麼暴力清理真的不是很合適。Liangent留言 2016年4月22日 (五) 04:26 (UTC)[回覆]
若是以/原名|[文簡简縮缩]|tfrom/以及其他已發現的模式來篩選連結的前後文,您覺得是否可行呢?或者您是怎麼處理原文:{{lang-en|...}}的呢?可否讓我們借鏡一下 :) Kanashimi留言2016年4月22日 (五) 07:48 (UTC)[回覆]
free-form text的我不管……我只處理明確使用了tsl或ilh模板的。Liangent留言 2016年4月22日 (五) 19:07 (UTC)[回覆]
謝謝您的意見。這邊會考量前後文以後再行測試。以及,或許我們可以把原文:abc改成英語:abc以至之類?我想這是可以在掃瞄的時候一併完成的。Kanashimi留言2016年4月22日 (五) 23:32 (UTC)[回覆]
已做新的測試。再麻煩看一下有無問題。Kanashimi留言2016年4月27日 (三) 16:01 (UTC)[回覆]
[3],我真覺得試圖去parse自然語言寫的內容不太靠譜……Liangent留言 2016年4月29日 (五) 21:53 (UTC)[回覆]
經過處理了幾百個例子後,發現因為不能確定前面的一定是泛用的翻譯,上面這種轉換法似乎已是最好的處理方式了。這樣提供了人類編輯時一個好的參考,而且想看中文的就能簡單閱覽。未知您的意見如何?Kanashimi留言2016年4月29日 (五) 22:46 (UTC)[回覆]
已做了近2K次測試,現在頗穩定了。再麻煩確認一下。Kanashimi留言2016年5月2日 (一) 10:52 (UTC)[回覆]
隨便在貢獻里點了幾個都能發現不適當的,這種東西要麼人工一個一個核對,要麼請只清理顯式應用了ilh模板的。還有這是在幹什麼?--Jimmy Xu 2016年5月3日 (二) 03:40 (UTC)[回覆]
未完成,如上討論。--Jimmy Xu 2016年5月3日 (二) 03:40 (UTC)[回覆]