如果你作為商業領袖向我描述你的症狀,而我將其輸入至ChatGPT,你是否會期望我在不諮詢醫生的情況下為你生成並開出治療計劃?
如果我提出一個交易:世界頂尖的數據科學家會加入你的組織,但你所有的商業專家必須轉到競爭對手那裡,這樣你會得到數據,但沒有專家來提供背景,你會怎麼辦?
在當今人工智能驅動的環境中,關於整合生成式人工智能的機會、風險和最佳實踐的聲音層出不窮,特別是語言模型如GPT-4或Bard。每天都有新開源模型的公告、研究突破和產品發布。在這快速發展的過程中,人們對語言模型的能力表示關注,但語言只有與知識和理解相結合時才能發揮效用。例如,如果有人死記硬背所有與化學相關的詞彙,但缺乏基礎知識,那麼這些記憶的語言依然無法發揮作用。
正確的配方
語言模型可能會誤導,因為它們可以生成內容卻沒有真正的理解。例如,如果要求創造一個新配方,它們可能會分析先前的食譜尋找相關性,但缺乏什麼味道好吃的內在知識。這將導致不尋常的組合,如橄欖油、番茄醬和桃子混合——這並不是因為模型擁有烹飪專業知識,而是因為缺乏這些材料的數據。
因此,語言模型生成的精心設計的食譜是基於廚師專家的輸入而統計得出的。有效的語言模型的關鍵在於專業知識的整合。
專業知識結合語言、知識與理解
“相關性並不意味著因果關係”這一句話對數據專業人士而言非常重要,強調將兩個不相關現象錯誤連結的風險。雖然機器擅長識別相關性和模式,但真正的專業知識需要辨識因果關係並指導決策。在我們的學習旅程中,語言僅僅是起點。隨著孩子們語言的發展,照顧者會傳授有關環境的知識。最終,他們理解因果關係,將動作如跳進湖中與結果聯繫起來。成年後,我們內化了複雜的專業知識結構,將語言、知識和理解交織在一起。
重建專業知識的結構
在探索任何主題時,擁有語言而沒有知識或理解並不等同於專業知識。例如,我可能知道汽車有一個變速器和一個帶有活塞的引擎,但我對它們如何運作的理解和修理能力則需要實際經驗——這正是我缺乏專業知識的地方。
將此轉換到機器上下文,沒有相關知識或理解的語言模型不應做出決策。讓語言模型獨立運行就像是把工具箱交給一個只知道如何預測與汽車相關的下個單詞的人。
通過重建專業知識來駕馭語言模型
要有效使用語言模型,我們需要從專業知識開始,然後進行逆向工程。機器學習(ML)和機器教學專注於將人類專業知識轉化為機器可讀格式,使機器能夠自主決策,從而增強人類進行細緻決策的能力。
對人工智能和機器學習的一個常見誤解是數據是最重要的元素。而實際上,專業知識佔據了這一位置。如果模型缺乏專家的指導,那麼它能從數據中得到什麼有價值的見解呢?通過識別專家認為有益的模式,我們可以將這些知識轉化為機器語言,促進自主決策。因此,這個過程始於專業知識並逆向推進。例如,機器操作員可能會識別某些聲音表示需要調整。通過給機器配備傳感器,這種專業知識可以轉化為機器語言,從而讓操作員可以專注於其他任務。
識別關鍵專業知識
在構建人工智能解決方案時,組織必須確定哪些專業知識最為關鍵,並評估失去該知識的風險與自動化相關決策的潛在好處。
某個過程中,是否有一名員工是至關重要的?常規任務是否能轉移到自主系統上,以便為員工提供更多時間?經過這一評估後,組織可以討論如何將高風險或高回報的專業知識轉化為機器語言。
幸運的是,專家系統的基礎工作通常已經建立。語言模型可以利用已編程的現有專業知識。
從探索到運營
在未來十年,市場環境將根據組織在人工智能上的投資而變化。作為一個警示的例子,想想Netflix,它在2007年推出流媒體服務,僅三年後就導致Blockbuster破產,儘管Blockbuster早期也在同一領域有所努力。
當競爭對手推出先進的人工智能應用時,其他公司可能會發現適應已經為時已晚,尤其是考慮到開發強大解決方案所需的時間和技能。
到了2030年,選擇反應而不是創新的公司可能會面臨不相關的境地,恰如Blockbuster的命運。
商業領袖不應該等待其他人追趕,而應主動探索他們可以創造哪些獨特的市場定位,促使競爭對手急於尋找答案。在這個自主轉型的時代,優先將操作專業知識轉移到機器上並展望未來市場動態的組織將鞏固其市場地位。