將決策系統描述為“算法”通常是人們轉移決策責任的一種方式。對許多人來說,“算法”指的是一套基于客觀經驗證據或數據的規則,是一個極度復雜的系統,以致人類很難理解其內部工作原理或預測算法運行時的反應。
但這種描述準確嗎?也不總是。
例如,去年 12 月下旬,斯坦福醫學中心把新冠疫苗的分配不當歸咎于一種分配“算法”,該算法偏向高級管理人員,而非一線醫生。據《麻省理工技術評論》當時的報道,這家醫院聲稱,為了設計“非常復雜的算法”,醫院已經咨詢了倫理學家,其中一位代表表示“完全行不通”。盡管許多人認為算法涉及人工智能或機器學習,但該系統實際上是一個醫學算法,在功能上是不同的,更像是一個非常簡單的公式或者是人類委員會設計的決策樹。
這種脫節突顯了一個日益嚴重的問題。隨著預測模型的激增,公眾在做出關鍵決策時變得更加謹慎。但決策者在開始制定評估和審計算法的標準時,首先必須定義決策的類別或他們決策適用的輔助工具。給“算法”這個術語保留解釋的余地,可能會讓一些影響最大的模型超出了確保這類系統對人沒有壞處的政策的影響范圍。
如何識別算法
那么斯坦福醫學中心的“算法”是一種算法嗎?這取決于你如何定義這個詞。雖然“算法”還沒有一個公認的定義,但計算機科學家哈羅德·斯通在 1971 年編寫的教科書里給出了一個普遍的定義:“算法是精確定義一系列操作的一套規則。”這個定義包羅萬象,從配方到復雜的神經網絡:基于算法的審計策略涉獵太廣泛了。
在統計學和機器學習中,我們通常認為算法是計算機為了解數據執行的指令集。在這些領域中,產生的結構化信息通常稱為模型。計算機通過算法從數據中了解到的信息可能看起來像“權重”,可以乘以每個輸入因子,也可能要復雜得多。算法本身的復雜程度可能也不同。這些算法產生的影響最終取決于它們所應用的數據和最終模型運行的情況。同樣的算法在一種情況下可能會產生積極的影響,而在另一種情況下又會產生截然不同的影響。
在其他領域,上述模型本身被稱為算法。盡管這令人感到困惑,但從最廣泛的定義來看,這也是準確的:模型是定義一系列操作的規則(通過計算機的訓練算法來了解規則,而不是由人類直接表述)。例如,去年在英國,媒體報道一種“算法”不能給由于疫情無法參加考試的學生公平打分。這些報道確實討論的是模型——把輸入(學生過去的表現或老師的評價)轉化為輸出(分數)的指令集。
斯坦福醫學中心發生的事情就好像是人類(包括倫理學家)坐下來,決定該系統應該采用怎樣的操作,從而根據員工的年齡和部門等輸入信息決定這個人是否應該首先接種疫苗。據我們所知,這一系列操作并沒有基于優化某個定量目標的估計程序。這是一套如何讓疫苗優先化,以算法的語言固定下來的規范性決策。這種方法在醫學術語和廣義定義中被視為一種算法,盡管其中唯一涉及的智能是人類。
關注影響,而不是投入
立法者也在爭論什么是算法。美國國會在 2019 年引入的 HR2291 或算法責任法案使用了“自動決策系統”一詞,將之定義為“機器學習、統計數據或其他數據處理、人工智能技術等得出的計算過程,以此作出決策或幫助人類決策,影響消費者?!?/p>
人工智能審計可能會忽略某些類型的偏見,而且也不一定能證明招聘工具是否給崗位挑選了最好的候選人。
紐約市也在考慮引進 Int 1894 法,這項法律將對“自動化就業決策工具”采取強制性審計,該工具定義為“功能由統計理論決定的系統或由這類系統定義參數的系統”。值得注意的是,這兩個法案都要求審計,但只提供了有關什么是審計的高級指導方針。
隨著政府和產業的決策者都在為算法審計制定標準,對“什么是算法”的意見可能會出現分歧。我們建議主要根據算法產生的影響來進行評估,而不是想著給“算法”下一個統一的定義或統一審計方法。關注結果而不是投入的話,我們就能避開技術復雜程度這些沒必要的爭論。無論我們討論的是代數公式還是深層神經網絡,重要的一點是會不會造成危害。
在其他領域的影響是一個關鍵的評估因素,它被嵌入到網絡安全領域的經典 DREAD 框架中,21 世紀初微軟首次了推廣這一框架,目前還有一些企業在使用。DREAD 框架中的“A”要求威脅評估人員詢問有多少人會受到一個確定的計算機安全隱患的影響,從而量化“受影響的用戶”。影響評估在人權和可持續發展分析中也很常見,我們已經看到一些人工智能影響評估的早期開發者建立了類似的規則。例如,加拿大的《算法影響評估》基于 “該業務領域的客戶是否特別容易受到影響? (是或否)”等定性問題打分。
無論我們討論的是代數公式還是深層神經網絡,重要的一點是會不會造成危害。
在評估中引入“影響”這樣一個定義廣泛的術語肯定比較困難。DREAD 框架后來被 STRIDE 補充或取代,部分是因為協調威脅建模所需內容的不同觀點帶來了挑戰,微軟在 2008 年停用了 DREAD。
在人工智能領域,會議和期刊已經引入了影響聲明,公眾對此褒貶不一。這并非萬無一失:純粹公式化的影響評估很容易露出馬腳,而過度模糊的定義可能導致評估武斷或冗長。
盡管如此,這仍然是向前邁出的重要一步。“算法”一詞,無論如何定義,都不該成為設計和部署系統的人逃避責任的盾牌。這就是公眾要求算法問責的呼聲越來越高的原因,而“影響”一詞的概念為不同團體滿足這一需求提供了一個有用的共同基礎。
編輯:lyn
-
算法
+關注
關注
23文章
4615瀏覽量
92986 -
人工智能
+關注
關注
1791文章
47352瀏覽量
238771 -
預測算法
+關注
關注
0文章
18瀏覽量
8227
原文標題:什么是“算法”?仁者見仁,智者見智
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論