LLM 對軟件研發的單點提效,我之前錄制過一段視頻,大家可以直接觀看,里面有詳細的演示,我在這里就不再贅述了。
除此以外,我這里羅列一些更多的可能用途:
智能代碼提示
代碼片段智能生成
SQL 語句的智能生成與調優
更高效更精準的靜態代碼檢查與自動修復(非 rule-based)
智能輔助的代碼評審與代碼重構
單元測試和接口測試代碼的自動生成
更高級的重復代碼檢查(語義重復檢查)
失敗用例的自動分析與歸因
看到這里,你有可能會得出一個結論:完蛋了,程序員要大面積失業了。真的是這樣嗎?要回答這個問題,我們需要從全局來看問題,首先我們要搞清楚,LLM 對于軟件研發,什么變了?什么沒有變?
2LLM 對于軟件研發,什么變了?
看了上面的案例,你應該已經能夠體會到 LLM 對于軟件研發單點效率提升的各種可能性,這些能力讓我們看到了軟件研發的變化,我把這些變化總結為:基礎編碼能力的知識平權,進而帶來局部效率的提升。
以前工程師個體學習掌握一門計算機語言以及相應的數據結構和算法,需要較長的學習周期,很多經驗和模式還需要工程師個體在大量實踐中進行總結,每個工程師個體都在重復著這個過程,現在 LLM 讓一個沒有接受過系統培訓的個體也能擁有同樣的能力,個體和個體之間的能力差異被 LLM 拉平了,這就是知識平權。
如果說 ChatGPT 實現了數字時代知識的平權,codex 類的代碼語言大模型實現了基礎編碼能力的知識平權,進而帶來軟件研發的局部效率提升。
可以說,LLM 降低了軟件開發的門檻,可以讓更多對軟件開發感興趣的人更加輕松地參與到軟件開發工作中,同時,LLM 提高了編程的效率和質量,使我們可以在更短的時間內完成更多的工作,因而能留出更多的時間讓我們思考。
前段時間,前哈佛大學計算機科學教授,曾在 Google 和 Apple 擔任高級工程職位的 Matt Welsh 發表了一個視頻,其中的主要觀點是“LLM 將會代表著編程的終結”,他認為程序員會被淘汰,未來只有產品經理和代碼審查員。我不知道大家對這個怎么看?
我的觀點是,在抱有敬畏之心的同時,我們不要輕易下結論。為什么,因為軟件研發還有很多東西是沒有變的,而這些沒有變的才是軟件工程中的核心問題和主要矛盾。
3LLM 對于軟件研發,什么沒有變?
我們面對的是軟件工程的問題,編程不等于軟件工程,編程只是軟件工程的一部分。軟件工程的四大內在特性(復雜度、不一致性、可變性、不可見性)并沒有因為 LLM 的出現而發生本質上的變化,這才是軟件工程面臨的主要矛盾。
從復雜度的角度來看,問題域本身的復雜度并沒有變,本質復雜度也沒有變,變的可能只是一部分的隨機復雜度。雖然說局部編碼變簡單,或者說更高效了,但是需求分析和軟件設計并沒有因為 LLM 而變得簡單,這個稍后我們來詳聊。
從一致性的角度來看,由于軟件研發的本質依然是“知識手工業者的大規模協作”,所以我們非常需要一致性。如果系統是一致的,則意味著相似的事情以相似的方式完成,錯并不可怕,怕的是錯的千變萬化。LLM 的出現并沒有提升軟件研發的一致性,甚至由于 LLM 本身的概率屬性,使用 LLM 實現代碼生成的不一致性問題反而是被放大了,這點我們后面展開講。
從可變性的角度來看,軟件會隨著需求不斷演進和變化,所以架構設計和模塊抽象只能面向當下,它天然是短視的,或者說是有局限性的,這種局限性即使是最優秀的架構師也是不可逾越的。
在敏捷開發模式下這個問題更被凸顯了出來,而且需求本身就是零散的,目標也是模糊的,在沒有全局視圖的情況下,架構自然就是有局限性,所以需要不斷迭代變更。每個迭代,你能拿到的信息僅僅是宏大視圖中的小小一角,根本沒有全貌,LLM 對此也是無能為力的。
從不可見性的角度來看,軟件的客觀存在不具有空間的形體特征,不同的關注點,會有不同的圖。綜合疊加這些圖是困難的,而且強行可視化的效果會造成圖的異常復雜,反而失去了可視化的價值。設計無法可視化就限制了有效的溝通和交流。
如果以上四點再疊加上大型軟件的規模效應,其中包含軟件系統本身的規模和軟件研發團隊的規模,問題就更嚴重了,即會顯著提升軟件研發過程中的溝通成本、決策成本、認知成本和試錯成本,而這些才是軟件工程問題的本質,這些本質問題自始至終都沒有變過,LLM 對此也基本無能為力。
基于上述的分析,我們可以看到,軟件工程的核心矛盾并沒有改變,現代軟件工程應對的是規模化場景下的各種問題,基于 LLM 實現的編程提效只是其中的一小部分,而其中最重要的需求和代碼演進模式都沒有發生本質變化,我們接下里分別展開討論一下。
4需求的重要性沒有變,在 LLM 時代還被放大了
只有我們的需求足夠的清楚,那么生成的代碼才會準確。如何準確全面描述需求成為了關鍵。面向自然語言編程,首先你要有能力把話講清楚。但是問題是:你能講清楚嗎?
我們通過一些實踐發現,要把需求描述到讓它能正確寫出來代碼,需要的工作量似乎已經接近甚至超過編碼了。為什么會這樣,有兩個方面的原因。
一是因為大多數的代碼實現是 imperative 的,而需求描述是 declarative 的,這兩者對人的要求完全不一樣。我們程序員群體接受的教育是編程,而不是需求描述,也就是說程序員本來更擅長寫代碼,而不是描述需求。
二是因為在當前的開發模式下,程序員直接用代碼默認幫需求(產品經理)做了很多代償。很多在需求中沒有明確提及的內容被程序員用代碼直接實現了(代償)。而現在要倒過來先把需求的細節完全理清楚這個可能不是程序員當前的工作習慣。而且代碼的信息熵其實要大于自然語言,程序員更善于用代碼而非自然語言來描述事務。
舉個例子:如何清楚地描述一個排序函數 sort 的需求?sort 輸出的數字必須是從小到大排列的,這樣描述需求就夠了嗎?其實遠遠不夠,重復數字怎么處理?排序數據的數量有沒有上限?有的話如何提示?排序時長需要有超時設計嗎?是預先判定還是中途判斷?算法復雜度有明確的要求嗎?算法需要應對并發嗎?并發的規模怎么樣?等等。
一個軟件的需求,不僅僅是功能性的,還有很多非功能的需求,這些都是需要描述清楚的。另外代碼實現的時候,還要考慮為可測試而設計,為可擴展而設計,為可運維而設計,為可觀測而設計等等。原本這些很多是開發代償了,現在要從需求生成代碼,你必須要提前講清楚。
所以,我們的總結是:“軟件從業者高估了編程的復雜度,但是卻低估了功能和設計的深刻度”。
5代碼是持續“生長”出來的,需要持續更新
對于現行的軟件開發范式,當需求發生變動后,一般是會在原有代碼基礎上改動,而不是直接從頭全量生成全部代碼,這個時候,LLM 本質上做的是局部編程的輔助(pair programming)。局部編程輔助過程中,經常需要對代碼做局部修改,而這個往往并不容易。
我們知道,代碼的信息熵大于自然語言,用信息熵更低的自然語言去描述代碼,尤其是準確描述大段代碼中的若干個位置往往是困難的。想象一下,如果只用在線聊天的方式跟別人講在代碼的什么地方做修改的效率是何其低下,相比指著屏幕,或者使用專門的 CR 工具,效率的差距是巨大的。
如果需要進一步描述如何修改就會更困難,因為大概率需要用到很多代碼上下文的相關描述,所以對于 prompt 的表述要求以及長度要求都很高。
另外,LLM 接納修改意見(prompt)后的輸出本身也是不穩定和不收斂的,同時也具有不可解釋性,LLM 本質上不是基于修改意見(prompt)進行改寫,而是基于修改意見(prompt)重新寫了一份。輸出的代碼需要人重復的閱讀和理解,使得認知成本變高了。
同時,LLM 的原理決定了其會“一本正經的胡說八道”的本質,會混合捏造一些不存在的東西,可以說人工智能的混合捏造是人工智能在無知情況下的“自信”反應,而這個點在代碼生成上是災難性的,比如會將不同類型的 SQL 語句混在一起使用,會分不清 Go 語言的 os.Kill 和 Python 語言的 os.kill()。這個問題可能需要使用 AI 審計 AI 的方式來緩解了。
剛才提到,要在原有代碼基礎上修改,就需要利用已有的代碼上下文,而不是從 0 開始。要實現這一點,一個最樸素的做法就是把整個項目的代碼都貼到 prompt 里,但這樣并不現實。因為 GPT-3.5 限制最多只能 4096 個 tokens,GPT-4 最多 8192 個,除非項目非常小,否則根本放不下。這個問題可能需要用 langchain 來解決了。
LangChain 是一個鏈接面向用戶程序和 LLM 之間的一個中間層,通過輸入自己的知識庫來“定制化”自己的 LLM。langchain 使用 embedding 建立基于項目特定的向量知識庫,實現“基于特定文檔的問答”。
6LLM 時代,對軟件研發更多的思考 思考 1:替代的是碼農,共生的是工程師
在軟件開發過程中,當偽代碼級別的設計完成后,最后一公里的編碼實現會被 LLM 替代,因為基于記憶的簡單重復編碼不是人的優勢,而是機器的優勢。
這部分工作現在屬于碼農,也就是我們俗稱的 CRUD 仔和 API Boy,所以很多不涉及設計的碼農可能會被大模型替代。
而工程師需要關注業務理解、需求拆分、架構設計、設計取舍,并在此基礎上通過 prompt 學會與 AI 合作,從而實現“工程師 + LLM”形成 1+1 >2 的效果。這就是共生。
需要注意的是,這種共生必須始終保持人的主觀能動性,機器必須是 Copilot,也就是智能副駕駛,主駕駛位置必須是人,這樣的人 - 機關系才能長期健康發展。這也就是為什么說微軟現任 CEO 薩提亞強調 Copilot(智能副駕駛)是比 Autopilot(自動駕駛)還先進的根本原因。
另外,特別要提的是:短期內率先學會使用 LLM 的工程師必將獲益,但是很快大家都會掌握,這個時候能力水平就再次被拉平了,這個很像之前“外賣騎手困在系統里”那篇文章中的觀點,所以作為共生的工程師,我們更需要從以下三個方面來強化自己的能力:
需求理解、需求分析、需求拆解的能力
架構設計、架構分析、設計取舍的能力,并推動設計的文檔化和規范化
理解問題本質,而不是單純學習應用(授人以魚不如授人以漁)
思考 2:有利于控制研發團隊規模,保持小團隊的優勢
隨著一個軟件規模的擴展,軟件項目參與的人越來越多,分工越來越細,人和人之間需要的溝通量,也指數增長。很快你會發現,溝通花費的時間,漸漸地就比分工省下來的時間還要多。說白了,過了一個臨界點,人越多不是越幫忙,而是人越多越添亂。一個人 12 個月能完成的事,不見得上 12 個人 1 個月就能完成,甚至 12 個月也未必能完成。
《人月神話》里建議了一種組織方式,叫“外科手術式的隊伍”。就像一臺外科手術一樣,有一個主刀大夫,軟件項目也應該有一個首席程序員,其他人都是給他提供支持的。這樣,就既能獲得由少數頭腦產生的產品完整性,又能得到多位協助人員的總體生產率,還徹底地減少了溝通的工作量。
但是軟件規模大了之后,需要的程序員數量必然會更多,團隊規模一定會加速擴展。但是 LLM 的出現,讓基礎編程工作一定程度上實現了自動化,這樣非常有利于控制研發團隊規模,保持小團隊的效率優勢。
思考 3:暗知識
大模型的成功很大程度上來自于對已有的互聯網文本語料和專業書籍等資料的學習。相對應,在軟件工程領域,需要學習的不僅僅是代碼,還應該包括需求,設計。
但是,很多需求和設計并不以文檔的形式存在,往往會存在于程序員和架構師的腦子里,或者在討論的過程中。就算有文檔,文檔和代碼大概率不同步。就算文檔同步,文檔(需求和設計)背后經常有大量的方案對比和推敲,甚至有很多要在原有債務基礎上的設計妥協,這些決策過程一般都不會明確地被記錄下來。這些沒有被文檔化下來的知識,我們稱其為“暗知識”。
雖然我們說只要有足夠的數據,大模型就可以學到需求和設計知識。但這些“暗知識”本身就很難被捕捉到,“足夠的數據”這一前提在需求分析和軟件設計可能難以滿足。
另外,在實際軟件開發中,需求可能一次不能表達得很清楚,需要一邊開發一邊逐步寫清楚需求。尤其是敏捷開發更是如此。所以一些通用的,不需要特定領域知識的問題,LLM 的表現會比較好,但是那些專用的,需要特定領域知識(私域知識)的問題,LLM 就可能不是很擅長。
總結來看:“你能想到的多過你能說出來的,你能說出來的多過你能寫下來的。”所以這就天然限制了 LLM 能力的上限。
思考 4:Prompt 即代碼,代碼不再是代碼
讓我們做個大膽的設想,如果當軟件需求發生變化的時候,我們不再是去改代碼,而是直接修改需求對應的 prompt,然后基于 prompt 直接生成完整的代碼,這個將是軟件開發范式的改變。
在這種范式下,我們需要確保代碼不能有人為修改,必須都是由 prompt 直接生成,此時我們還需要對 prompt 做版本管理,或許會出現類似今天 git 的 prompt 版本管理的新物種。
此時,從本質上來看 prompt 即是代碼,而原本的代碼不再是代碼了,這就真正實現了基于自然語言(prompt)的編程,此時的編程范式將從 prompt to code 轉變為 prompt as code。
更進一步思考,當實現了 prompt as code,我們是否還需要 code,關于代碼的很多工程化實踐還重要嗎?現在我們之所以認為代碼工程化很重要,因為代碼是人來編寫,代碼是人來維護的。而當代碼由 LLM 來編寫,由 LLM 來維護的話,那么現有的軟件架構體系還適用嗎?這個時候或許才真正實現了軟件研發范式的進化。
思考 5:直接可運行,prompt to executable 軟件開發范式的可能性
在深入一步思考,直接可運行,prompt to executable 的基礎設施會出現嗎?
代碼只是軟件工程中的一部分,遠遠不是軟件工程的全部,你想想你有多少時間占比是在編碼的。一般來講,編碼完成后往往要經歷 CI 和 CD 等一些列的工程實踐才能向終端用戶交付價值。
所以全新的軟件范式是否可以實現從 prompt 直接到可運行的程序實例?目前來看,或許 Serverless 是可能的架構之一。
思考 6:計算機教育的反思
LLM 出現后,關于對計算機教育的反思我認為有兩個層面的思考:
首先是,計算機學科研究方向的變化,之前 NLP、知識圖譜、代碼理解,代碼缺陷發現、test oracle 生成等都是獨立的研究方向,但是 LLM 表現出的 AGI 能力似乎讓這些垂直領域的研究失去的意義,因為 LLM 的 AGI 能力都能解決,或許效果還更好。
所以這些研究方向將何去何從是需要我們思考的。有人說 LLM 是 NLP 的新里程碑,但也有人認為其更像是 NLP 的墓志銘,這句話很好的表達了我的觀點。
其次,LLM 一次次地證明了通過“死記硬背 + 簡單推理”就能通過大多數人類的考試和技術面試。那教育的終極目標又是什么?先進的人工智能嘗試把機器培養成人,而落后的教育試圖把人培養成機器。計算機教育,其實我們整個教育到了需要徹底反思的時刻了。
或者我們都錯了?!
彼得德魯克說過“動蕩時代的最大風險不是動蕩本身,而是企圖以昨天的邏輯來應對動蕩”,今天 LLM 對軟件工程的影響,我還是在以以往的邏輯在做分析,這個基礎可能本來就是錯誤,全新的時代需要全新的思維模式,然后我們拭目以待。
審核編輯:劉清
-
編碼器
+關注
關注
45文章
3655瀏覽量
134886 -
SQL
+關注
關注
1文章
771瀏覽量
44192 -
自動駕駛儀
+關注
關注
0文章
11瀏覽量
7565 -
ChatGPT
+關注
關注
29文章
1564瀏覽量
7865 -
LLM
+關注
關注
0文章
297瀏覽量
357
原文標題:LLM對程序員的沖擊和影響
文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論