微信推方言採集引爭議個人隱私安全性受關注

【人民報消息】中國社交平臺微信近期推出「方言採集」返現活動，邀請用戶錄製各地方言語音（即聲紋）以換取現金獎勵。活動上線後，有參與者稱累計獲得數百元收益。隨著參與範圍擴大，討論延伸至個人隱私問題，方言曾被中國網民視為相對隱蔽的交流方式，其安全性與可識別性開始引發關注。據中國媒體極目新聞4月10日報導，微信通過邀請方式向部分用戶推送「方言採集」任務。參與者按提示朗讀日常用語，完成語音錄入即可獲得現金獎勵。有用戶在社交平臺展示收益截圖，稱單日收入約40元。浙江從事語音識別研究的工程師黃一鳴接受自由亞洲電臺採訪時說，中國方言有上百種，甚至更多，另外還有方言變種，常說「十里不同音，百裡不同俗」，如果細分到縣、鄉、村，更無法統計：「方言語音數據一直比較缺，差異大，比如溫州話複雜，很多地方人都聽不懂，標註也比較難，通過對用戶錄音補充這些資料，是他們想做的事，可以提高模型在複雜語音環境下的識別能力，徵集這類數據主要收集做語音模型。」 有償徵集方言模型引熱議 用戶在微信平臺錄入當局指定的文字語音，審核通過後獎勵將在30天內發放至微信零錢。據瞭解，用戶每錄滿3句可獲得約1元，錄滿20句可獲5元，實際錄製量多在每天100至200句之間。據報導，中國130多種語言及各類方言中，68種使用人口不足萬人，48種不足五千人，25種已不足千人。對於微信平臺為何花錢徵集方言語音，黃一鳴表示，平臺需要提升網民語音識別準確率：「至於它的用途，我想大家都清楚，如果在微信用語音聊天，它是有工具識別的，但是沒有該方言的模型，就解不開，或者說難度比較大。」活動擴大後，討論開始從技術本身轉向這些語音數據可能的用途。長期以來，方言在一些非正式交流中被視為相對隱蔽的表達方式，識別難度在一定程度上降低了被自動化處理的可能。微信方面表示，該項目用於「提升語音識別體驗」。 網民憂方言識別被「濫用」 「連家鄉話都不安全了。」一條在社交平臺獲得較多回應的留言這樣寫道。該評論下方，多名用戶提到，過去使用方言交流的一個原因，是降低被系統識別的可能性。山東滕州網民齊先生告訴記者，當地有很多種方言：「滕州一個小小的地方，東西南北說話都不一樣，如果你語音輸入，它微信加不上無法識別，我覺得他們現在就是在收聲音數據，他在語音識別監控方面，肯定有很大的幫助。」關注個人隱私議題的學者余文天認為，這項技術本身不是問題，關鍵在於它會被用來做什麼。他對記者說：「如果是把方言轉成文字，這是有意義的，也應該肯定，但如果是用於審核方言內容，對批評言論進行干預，那對大部分網民來說，不是好事。」近年來中共在金融、電信等領域逐步引入聲紋識別技術，用於身份驗證與風險控制。所謂聲紋，是一種生物特徵，簡單來說就是人聲的「指紋」，能夠用於標識說話人身份。中國一些平臺也已具備語音轉寫與內容審核能力。從事語音技術研究的人士指出，隨著人工智慧模型訓練推進，語音數據在各類應用中的作用正在增加。截至目前，微信方面未就數據管理細節作出進一步說明。該活動仍處於邀請階段，尚未全面開放。（轉自自由亞洲電臺） △

微信推方言採集引爭議 個人隱私安全性受關注

微信推方言採集引爭議個人隱私安全性受關注