發布日期:2022-10-09 點擊率:78
美國馬薩諸塞大學研究人員Valentin Kassarnig為我們帶來了答案,他開發了一套撰寫政治演講稿的人工智能(AI)機器算法,機器寫出的講稿幾乎可以以假亂真。經典的政治演講少之又少,普普通通的演講倒是很多,比如美國國會的辯論演講。這些演講大多千篇一律,都遵循標準的格式,重復相似的論調,甚至使用一樣的短語來表述特定的政治立場和觀點。看起來好像背后有一套算法在決定它的內容。于是它引導我們去思考一個有趣的問題:有沒有可能讓機器自動撰寫政治演講稿呢?
分析文本預測單詞
從表面上看,基本原理還是很簡單的。Kassarnig首先建了一個數據庫,從53場美國國會辯論中抽取4000個政治演講片斷,編成一套“機器學習”算法,讓它自動撰寫稿件。這些政治演講由5萬多個句子組成,平均每個句子包涵23個單詞。凱斯塞寧將演講按政黨進行分類,比如哪些是民主黨的,哪些是共和黨的,看它們是否贊同或者反對某個特定的主題。
魔鬼在于細節,分析數據庫是最大的挑戰。在嘗試了許多種技術之后,Kassarnig最終采用了基于“N-grams(元語法模型即馬爾可夫模型)”的方法。他首先用詞類法分析文本,也就是用語法規則來給每一個詞語和短語作標志(標為名詞、動詞、形容詞等)。然后分析第6個詞或者短語,根據前5個詞或者短語判斷第6個詞或者短語最有可能是什么。Kassarnig說:“只要看它前面是5個是什么,我們就可以很快確定所有的單詞。”
在分析詞的過程中演講稿會同步生成。Kassarnig需要告訴算法寫什么類型的演講稿,比如是給民主黨寫還是給共和黨寫。算法最開始會按給定的類別搜索6個詞或者短語組成的數據庫,然后用5個詞或者短語作為起點來撰寫演講稿。
下一篇: PLC、DCS、FCS三大控
上一篇: 索爾維全系列Solef?PV