1. 什么是Prompt?
自從人工智能生成內容AIGC(Artificial Intelligence Generated Content)火了之后,就各種聽得Prompt(提示)這個詞兒。那到底什么是Prompt呢?
Prompt(提示)是指在與人工智能模型進行交互時,向模型提供的一段文本或問題,用于引導模型生成相應的回答或輸出。提示可以是簡短的短語、完整的句子或是更長的段落,具體取決于應用場景和需求。對于ChatGPT這一類的對話類應用,Prompt就是提問者在提問框提出的問題和文字描述。而對于Mijdjourney之類的Text-to-Image圖片生成工具,Prompt就是描述圖片構圖、風格、色彩等要素的關鍵提示詞。
Prompt的形式可以多樣化,可以是一個問題、一句話、一個完整的對話片段,甚至可以是一段指令或描述。它們都是用戶用來激發模型生成回復的輸入。Prompt的內容和形式通常由應用場景和任務要求來確定。
而且,Prompt并不限于單一的文本輸入,它也可以包括其他形式的輸入,如圖像、音頻等,取決于模型的應用和能力。在不同的領域和任務中,Prompt的定義和使用方式可能會有所差異,但總的來說,Prompt代表了用戶提供的信息,用于引導模型生成相應的輸出。
2. 提示工程(Prompt Engineering)
由于受限于意圖識別、內容生成算法,導致Prompt的文字輸入和結果之間存在著“玄妙莫測”的關聯,甚至也不是簡單文案功底好那么簡單。好的Prompt能解鎖AI的潛能。為了充分發揮AIGC的潛能,還滋生出一門技術,叫:提示工程(Prompt Engineering)。提示工程是一種技術和方法,旨在優化和設計提示,以改善人工智能模型的表現和輸出結果。通過合理的提示設計,可以引導模型在特定任務上表現出更準確、可靠和可控的行為。當前的提示工程主要是為了彌補機器在自然語言理解和生成方面的能力限制,從而使其更好地適應人類的需求和期望。通過精心設計的提示,我們可以引導機器模型的行為,使其更加接近我們想要的輸出。
隨著AIGC滲透到各種任務重復性高、標準化程度高、創新和判斷能力的需求低、交互復雜性低的工作,并可以預見到它正以肉眼可見的速度滲透到創造性高和情感交互程度高的行業,懂得使用Prompt,已經成為職場工作的一項基本技能。在某些領域,甚至催生出提示師的崗位。提示師,就不是使用簡單Prompt,而是通過精準而清晰的語境、話術來引導AI,充分調動AIGC的創作潛能,以達到高質量的輸出,以下是一些這些工作崗位的示例:
-
廣告與市場營銷:創造有創意的廣告和市場策略。
-
產品設計與開發:新產品的創新和改進。
-
計算機編程:解決編程問題,編寫高效的代碼。
-
教育:教學策略,課程設計。
-
咨詢:為客戶提供創新的解決方案。
-
研發:科學和工程領域的新產品和解決方案。
-
創業:新的商業模式和創新的解決方案。
-
新聞和新聞報道:獨特的報道角度和深入的調查。
-
環境科學:研究新的環保技術和解決方案。
-
城市規劃:獨特的城市設計和規劃。
-
健康護理:開發新的治療方法和解決方案。
-
音樂創作:創新的音樂作品和音樂制作。
-
公共政策:開發創新的政策和解決方案。
-
心理咨詢:提供創新的治療方法和策略。
-
視頻制作:創新的劇本和劇情。
以上這些排序我是根據對人工智能模型的依賴程度、領域創造力和創新性、市場需求和潛在影響力等進行的排名。當然,知己知彼百戰不殆,真正能充分發揮AIGC潛能的還是開發和優化算法,解決AI問題的工程師。
我列的這些都是一些行業場景,但具體而言,提示工程(Prompt Engineering)到底解決了什么問題呢?我理解至少要包含以下幾個方面:
-
格式化提示:選擇合適的提示格式和結構,以便清晰地傳達任務要求和期望的回答格式。
-
信息注入:通過在提示中添加關鍵信息、上下文或領域知識,來指導模型生成更準確和相關的回答。
-
邏輯與約束:使用提示來引導模型按照特定的邏輯進行推理和回答,或者通過限制輸出的范圍和格式來確保結果的合理性。
-
消除歧義:有時候問題本身可能存在歧義,導致模型生成的回答不準確或不完整。通過精心設計的Prompt,可以提供更多的上下文信息或明確的指導,幫助模型理解問題并生成更準確的回答。
-
控制偏見:在提示工程中可以采取措施來減少模型輸出中的偏見或不當行為,通過設計合適的提示來鼓勵公正、中立和包容性。
-
提供任務導向性:通過適當的提示設置,可以引導模型在特定任務上產生期望的輸出,提高模型的任務導向性和結果的一致性。
-
領域特定性:對于特定的領域或任務,模型可能需要更多的領域知識和專業術語才能生成準確的回答。通過設計合適的Prompt,可以引導模型關注特定領域的信息,提高生成結果的相關性和準確性。
-
控制生成結果:Prompt技術可以用于限制模型的生成范圍,使其生成符合特定條件、風格、語氣或主題的內容,提供更大的控制力和可定制性。
-
解決數據稀缺問題:在某些情況下,數據可能稀缺或昂貴,Prompt技術可以通過少量樣本提示或零樣本提示的方式,使模型在缺乏大量標注數據的情況下仍能進行有效的學習和生成。
-
提高生成效率:通過自動提示生成和優化,可以減少人工設計和手動調整提示的工作量,提高生成效率和結果的準確性。
總而言之,提示工程的目的是使計算機模型更好地理解人類語言,并生成與人類期望相符的輸出。雖然對于人類來說,說話是自然而流暢的,但對計算機模型來說,提示工程可以提供額外的指導和優化,以確保生成結果更符合我們的預期和要求。
3. 思維鏈(Chain-of-thoughts)
AIGC理解人類意圖的里程碑,是在去年發生的,那就是思維鏈(Chain-of-thoughts)技術。
這就是原谷歌大腦工作的Jason Wei在2022年1月份發表的文章《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》,這也被稱為思維鏈的開山之作。OpenAI一看到這篇文章眼睛就亮了,趕緊把他挖了過去。不負眾望,思維鏈在 ChatGPT確實發揚光大。思維鏈直接把大模型的常規推理能力迅速拔到了一個高度。以前的語言模型,在很多挑戰性任務上都達不到人類水平,而采用思維鏈提示的大語言模型,在 Bench Hard(BBH) 評測基準的 23 個任務中,有 17 個任務的表現都優于人類基線。比如常識推理中會包括對身體和互動的理解,而在運動理解 sports understanding 方面,思維鏈的表現就超過了運動愛好者(95% vs 84%)。
思維鏈技術思維鏈是指在提示工程中使用一系列相關的提示來構建連貫的思維或邏輯鏈條,以引導模型生成更加一致和連貫的輸出。思維鏈可以被視為提示工程的一部分,它是一種更高級的提示設計和調優技術。通過構建連貫的提示序列,可以引導模型在生成文本時保持一致的主題、邏輯或上下文,并產生更連貫的輸出。
思維鏈的構建可以包括多個Prompt,每個Prompt都為模型提供了一部分信息或上下文。每個Prompt的生成都依賴于前一個Prompt的輸出,從而形成一個有序的思維鏈。這種方法可以在生成文本時保持一致性,使得輸出更加連貫和可理解。
這么說這個概念你可能不太理解,我可以舉個例子:
假設我們有一個問題:“約翰買了3本書,每本書的價格是10美元。他支付了多少錢?”在沒有思維鏈提示的情況下,一個大型語言模型可能會生成如下的回答:“約翰支付了30美元。”這個回答是直接根據問題的文字信息得出的,模型沒有展示任何推理或計算的過程。然而,如果我們應用思維鏈提示,模型將得到一系列中間推理步驟的引導,例如:
-
確定書的數量是3本。
-
確定每本書的價格是10美元。
-
計算約翰支付的總金額,即3(本書的數量)* 10(每本書的價格)= 30美元。
通過這些中間推理步驟的引導,模型能夠逐步理解問題的要求,并生成類似下面的答案:“約翰支付了30美元,因為他買了3本書,每本書的價格是10美元。”
這個例子中,思維鏈提示的引導使模型能夠展示它是如何得出答案的,它的推理過程變得透明可解釋。這對于復雜問題和需要多步驟推理的任務尤為重要。
思維鏈除了把一個問題分解為多個Prompt,也可以將上下文多個問題,整合起來,一起連貫性分析用戶的意圖。我們可以將其理解為一個由連貫的問題和回答組成的序列,每個問題和回答都建立在前一個問題和回答的基礎上,形成一個邏輯上連貫的思維過程。以下是一個示例:
-
問題 1: 請問明天的天氣怎么樣?
-
回答 1: 明天將有陣雨和多云,氣溫約為20攝氏度。
-
問題 2: 這樣的天氣適合戶外活動嗎?
-
回答 2: 陣雨可能會影響戶外活動的舒適度,建議備好雨具或考慮室內活動。
-
問題 3: 有沒有室內活動的好建議?
-
回答 3: 您可以考慮去電影院觀看新上映的電影,或者在家里看書、聽音樂或者做一些室內運動。
在這個例子中,問題和回答之間形成了一個連貫的思維鏈。每個問題都是基于前一個問題的回答,而每個回答又為下一個問題提供了信息和上下文。這種連貫性使得對話更加流暢和有邏輯。種交互的方式有助于進一步探索和深入討論特定主題或問題。思維鏈的技術,其實是一種基本的推理邏輯,也是人工智能邁向通用人工智能關鍵的一步。通過思維鏈,人工智能可以分析復雜問題中的邏輯連接詞和短語,并將其分解為一個一個相互關聯有推理節奏的小問題逐一回答,最終得到答案;也可以理解上下文,進行語境推理和信息擴展,進一步確認用戶意圖,并修正對之前不完整的意圖理解,進而更趨近于提問者的期望。
不過,需要注意的是,目前的對話式AI系統仍然具有一定的限制和挑戰,尤其是在復雜的語義理解和推理方面。隨著技術的發展,我們可以期待思維鏈技術會更加智能和流暢的對話體驗。
除了思維鏈技術,我們可能還聽到過以下兩個技術:零樣本提示(Zero-shot Prompting)和 少量樣本提示(Few-shot Prompting)。這兩個也是在大模型訓練后,在達到通用人工智能的必經之路。
4. 零樣本提示(Zero-shot Prompting)
零樣本提示旨在通過給模型提供一些關鍵信息來解決在沒有事先見過相關樣本的情況下進行推理和回答問題的挑戰。它允許模型在沒有直接訓練樣本的情況下,通過理解提示中的信息和推理來生成答案。
為了方便大家理解,我舉個例子,假設我們有一個基于語言模型的問答系統,我們想要使用零樣本提示來回答一個關于巴黎塔的問題。這個問題是:“巴黎塔有多高?”
首先,如果沒有訓練過巴黎塔,人工智能可能無從回答。但如果基于零樣本提示的分析,模型可以推斷出相關的知識,例如能以巴黎城市命名的塔,巴黎塔就是巴黎的一座標志性建筑,很可能就是艾菲爾鐵塔,而艾菲爾鐵塔的高度是被訓練過的一個確切信息,所以即使模型在訓練數據中沒有直接提到"巴黎塔的高度"的樣本,它仍然可以使用這些推斷來生成一個合理的回答,比如"巴黎塔的高度是324米"。
這里的關鍵是,零樣本提示為模型提供了一些背景信息和線索,幫助模型進行推理和解答問題。盡管模型沒有直接訓練樣本來回答特定的問題,但它可以通過理解提示中的信息和進行推理來生成答案。不過零樣本提示,也存在人工智能誤判的情況,著就會出現我們經常見到的所謂的ChatGPT一本正經地說瞎話,很可能就是這種零樣本提示技術下展示出來的“自信”。
5. 少量樣本提示(Few-shot Prompting)
少量樣本提示旨在通過在訓練過程中提供少量的樣本示例來增強模型的能力。這些示例通常來自于與特定任務或主題相關的數據集,而不是全面覆蓋所有可能情況的大型數據集。通過引入這些示例,模型可以利用它們所包含的模式和特征來進行泛化,并在遇到類似問題時進行推理和回答。
舉個例子,假設我們有一個基于語言模型的任務,要求模型完成英語翻譯成法語的任務。在少量樣本提示的情況下,我們可能提供了一些針對特定短語或句子的翻譯示例,如:
英文:"Hello",法文:"Bonjour"
英文:"Thank you",法文:"Merci"
英文:"Goodbye",法文:"Au revoir"
通過這些少量的樣本提示,模型可以學習到一些常見的翻譯模式和規則,比如將英文中的"Hello"翻譯成法文的"Bonjour"。當遇到新的輸入時,模型可以利用這些學到的模式和規則進行翻譯,并生成合理的回答。
少量樣本提示的關鍵在于提供了一些具體的示例來指導模型的學習和推理過程。盡管訓練樣本有限,但模型可以通過觀察和泛化這些示例中的模式和特征來進行有效的推理和回答。其實少量樣本提示的過程,很類似人類舉一反三的能力,也就是歸納提煉和演繹的推理能力。
所以,從上面的解釋大家能看出來,零樣本提示在讓模型在沒有任務特定樣本的情況下進行推理和生成。通過合理設計的Prompt,可以從未見過的數據中產生有意義的輸出。少量樣本提示使得模型能夠通過很少的樣本進行學習和適應,通過在Prompt中提供有限的示例或示例的變體,可以從中學習并推廣到類似的情況。這兩種都是AIGC提示工程泛化的關鍵能力。
以上都是提示工程好的技術,其實提示工程,還需要解決一類非常棘手的問題,那就是惡意提示(Malicious Prompts)。
6. 惡意提示(Malicious Prompts)
惡意提示(Malicious Prompts)指的是有意設計的、具有潛在危害或不良影響的輸入提示,旨在誤導或欺騙語言模型產生不準確、有害或不當的回復。這些惡意提示可能會導致模型生成虛假信息、歧視性內容、攻擊性語言或其他不良行為。以下是三種常見的惡意提示的情況:
-
越獄(Prompt Hacking):越獄是指嘗試繞過提示系統的限制,以獲得意外或不受控制的答案。這種惡意提示的目的是欺騙模型,使其生成不準確、誤導性或惡意的輸出。
-
提示泄漏(Prompt Leakage):提示泄漏是指在模型訓練過程中,模型學習到了提示中的敏感信息,導致在生成輸出時泄露這些信息。惡意用戶可以利用這些泄漏來獲取模型訓練數據或獲取其他敏感信息。
-
令牌走私(Token Smuggling):令牌走私是指通過將額外的信息嵌入提示或文本中,來繞過模型對輸入長度或格式的限制。這種惡意提示可以被用于濫用模型,例如在無權限的情況下執行高危操作或竊取敏感數據。
防止惡意提示是一個復雜的挑戰,沒有一種單一的解決方案可以完全消除惡意行為。綜合采取多種措施,并與用戶和研究社區緊密合作,才能更好地應對惡意提示的風險并提高模型的安全性。如何識別惡意,以及如何實施修正,是應對惡意提示的關鍵。壞人如果一本心思想繞過規則,他會各種嘗試,肯定會防不勝防。當然,要設置一些底線,不管壞人如何誘導,都不能執行。這些底線可以是對特定主題、內容或行為的嚴格限制,無論惡意提示如何,都不能越過這些底線。例如,在生成回復時,可以設置一些預定義的規則,禁止模型生成針對個人攻擊、仇恨言論、歧視性觀點等不當內容。除了設置底線,還需要考慮以下的措施:
-
數據過濾和審查:對訓練和測試數據進行仔細篩查,移除包含惡意或不適當內容的樣本。這有助于減少模型學習到惡意提示的可能性。
-
強化模型的倫理準則:在訓練和開發語言模型時,加入倫理準則和價值觀的指導,使模型具有尊重和負責任的行為。這可以通過在訓練數據中注入倫理原則,或通過約束生成的回復內容來實現。
-
引入對抗訓練:使用對抗訓練的技術可以增強模型的魯棒性,使其更難受到惡意提示的影響。對抗訓練的目標是通過模型與惡意輸入的交互來提高模型的抗干擾能力和泛化能力。
-
模型監控和反饋機制:建立強大的監控系統,實時檢測模型生成的回復。如果發現惡意提示或不當回復,及時采取行動,例如移除不當內容、禁止用戶等。同時,鼓勵用戶提供反饋,以幫助改進系統和快速修正問題。
-
持續學習和改進:定期更新模型,納入最新的惡意提示樣本,以不斷增強模型對惡意行為的識別和處理能力。同時,借鑒研究和實踐中的經驗,改進模型的安全性和魯棒性。
-
集體智慧和合作:積極與研究者、安全專家、社區用戶等合作,共同研究和解決惡意提示的問題。通過開放對話、分享經驗和合作研究,可以形成更加有效的防范策略和修正機制。邀請社區參與,鼓勵廣大用戶和研究者參與到模型的評估和改進中來。開放對話和合作有助于共同識別和解決惡意提示的問題,提高模型的安全性和可靠性。
防治惡意提示也是一個長效工作。正所謂魔高一尺道高一丈,只有持續改進,才能保證各種Prompt的漏洞得到及時修補和更正。
以上聊了很多提示工程的技術,那么這個技術的未來會發展成什么樣呢?
7. 提示工程技術的未來發展
可以預見,隨著意圖識別技術的進步,后面會越來越弱化對人對Prompt的約束,而人工智能的算法會進一步地提升。未來的人工智能經過與用戶的互動,系統可以更好地理解用戶意圖、獲取更多的上下文信息,并提供更準確、個性化的回復。未來的發展方向包括更智能的對話管理、更精細的用戶意圖理解以及更自然的語言生成,以實現更流暢、真實的對話體驗。
目前的Prompt還是以文字為主,后面必然會擴展到多模態交互。除了文字,Prompt還可以支持其他形式的輸入和輸出,如圖像、語音、視頻等。將多模態交互與Prompt結合,可以更好地滿足用戶的需求,提供更豐富、多樣化的體驗。例如,通過圖像輸入與文字輸出的Prompt,可以實現基于圖像的問題回答和指導。
當然,目前人工智能回答問題的推理過程還是黑盒,我們看不到,所以還是存在對大模型系統問題回答的不信任和猜忌,這都在情理之中。未來一定會在透明度和可解釋性上做得更好。通過透明度和可解釋性,提問者就會更了解Prompt生成回復的依據和推理過程,以增加對結果的信任和理解。因此,未來的Prompt發展方向包括提供更詳細的解釋和理由,使用戶能夠理解系統的決策和推理過程。
可能大家會說,如果將來的人工智能能夠達到通用人工智能水平,在自然語言理解方面沒有明顯的障礙,那么提示工程可能會減少其重要性。通用人工智能應該能夠更好地理解和處理人類語言,不需要額外的提示或約束來產生符合人類預期的結果。不過這種理想的認知也未必成為現實。人心隔肚皮,即便是人工智能達到通用人工智能的水平,要達到良好的溝通,依然需要大量的技巧,因為即便是個優秀的通用人工智能,也無法與不可理喻的人類直接溝通不是。所以,未來也許提示工程,就會演化為社會心理學的人際溝通學。每個人類個體都有人格、價值觀、知識結構、社會關系、文化背景、情緒狀態等極為特殊化的狀況。未來的通用人工智能,要理解人類的語言、非語言信號、肢體語言、情緒表達、文化禁忌、社會關系網絡和角色定位,仍然是極為挑戰的工作。所以我認為提示工程的生命力遠不會我們想象的那么短命,而是長時間人類和機器之間溝通磨合的長效工作。這就意味著Prompt技術的發展是一個不斷演化的具有長生命力的技術,絕對不是曇花一現。
-
開源技術
+關注
關注
0文章
389瀏覽量
7963 -
OpenHarmony
+關注
關注
25文章
3728瀏覽量
16396
原文標題:河套IT TALK96:(原創)GPT技術揭秘:解鎖提示工程的潛能
文章出處:【微信號:開源技術服務中心,微信公眾號:共熵服務中心】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論