源起基金關(guān)注領(lǐng)域——醫(yī)療AI(四)
人工智能研究框架國泰君安2023年8月研報(bào)人工智能研究框架,搭建了詳細(xì)的AI知識(shí)體系。
AI是研究如何使計(jì)算機(jī)能夠模擬和執(zhí)行人類智能任務(wù)的科學(xué)和技術(shù)。通過輸入大量資料數(shù)據(jù),讓計(jì)算機(jī)學(xué)習(xí)算法,總結(jié)出模型,之后再輸入相似樣本時(shí),就可以識(shí)別結(jié)果。優(yōu)勢在于模仿人類經(jīng)驗(yàn)學(xué)習(xí)的過程,無需人為制定規(guī)則,機(jī)器學(xué)習(xí)等算法和自我迭代是AI區(qū)別于傳統(tǒng)計(jì)算機(jī)能力的主要因素。
根據(jù)《AI:現(xiàn)代方法》,AI有七種分類,分別是推理和問題解決、知識(shí)表示、規(guī)劃和社會(huì)智能、感知、機(jī)器學(xué)習(xí)、機(jī)器人:運(yùn)動(dòng)和操縱,和自然語言處理。
圖|AI的七種分類
三、隨著各類算法的演繹和迭代,AI的子領(lǐng)域明朗化自然語言處理和計(jì)算機(jī)視覺等是AI技術(shù)的重要子領(lǐng)域。
1.自然語言處理
自然語言處理(Natural Language Processing,NLP)是AI和語言學(xué)領(lǐng)域的分支學(xué)科,讓計(jì)算機(jī)和系統(tǒng)能夠從文本和語音信號(hào)輸入中獲取有意義的信息,理解人類語言,并作出決策。可以從非結(jié)構(gòu)化自然語言中提取信息,處理信息并將其映射到結(jié)構(gòu)化變量。現(xiàn)有的醫(yī)學(xué)信息大多數(shù)以非結(jié)構(gòu)或半結(jié)構(gòu)的形式儲(chǔ)存在醫(yī)療信息系統(tǒng)中,NLP可通過機(jī)器翻譯將這些數(shù)據(jù)轉(zhuǎn)化為AI模型可用的結(jié)構(gòu)化數(shù)據(jù)語言,構(gòu)造醫(yī)學(xué)詞林,實(shí)現(xiàn)人機(jī)交互、數(shù)據(jù)管理等。主要有機(jī)器翻譯、情感分析和信息抽取幾大基礎(chǔ)任務(wù)。
機(jī)器翻譯,是指通過特定的計(jì)算機(jī)程序?qū)⒁环N書寫形式或聲音形式的自然語言,翻譯成另一種書寫形式或聲音形式的自然語言。主要能夠?qū)崿F(xiàn)語音翻譯、圖像翻譯、VR翻譯等。
情感分析,即指通過計(jì)算技術(shù)對(duì)文本的主客觀性、觀點(diǎn)、情緒、極性的挖掘和分析,對(duì)文本的情感傾向做出分類判斷。情感分析在評(píng)論機(jī)制的App中應(yīng)用較為廣泛。在互聯(lián)網(wǎng)輿情分析中,尤其是在選舉預(yù)測、股票預(yù)測等領(lǐng)域,情感分析起著舉足輕重的作用。
信息抽取,指從文本中抽取出特定的事實(shí)信息。被抽取出來的信息通常以結(jié)構(gòu)化的形式直接存入數(shù)據(jù)庫,可以供用戶查詢及進(jìn)一步分析使用,為之后構(gòu)建知識(shí)庫、智能問答等提供數(shù)據(jù)支撐。
圖|自然語言處理用于醫(yī)療場景
2.計(jì)算機(jī)視覺
計(jì)算機(jī)視覺(Computer vision,CV),是指讓計(jì)算機(jī)和系統(tǒng)能夠從圖像、視頻和其他視覺輸入中獲取有意義的信息,并根據(jù)該信息采取行動(dòng)或提供建議。該技術(shù)基于深度學(xué)習(xí)機(jī)器視覺算法的集合,通過構(gòu)造多層神經(jīng)網(wǎng)絡(luò),逐層完成圖像特征的提取,最終將多層級(jí)的特征組合,在頂層做出分類。主要有圖像分類、目標(biāo)檢測、目標(biāo)分割和實(shí)例分割幾大基礎(chǔ)任務(wù)。
圖像分類是判斷一張圖片的主要類別,是計(jì)算機(jī)視覺中最基礎(chǔ)的任務(wù)之一。目標(biāo)檢測是給定一張圖像或是一個(gè)視頻幀,讓計(jì)算機(jī)定位出這個(gè)目標(biāo)的位置并且知道目標(biāo)物是什么,即輸出目標(biāo)的Bounding Box(邊框)以及標(biāo)簽。目標(biāo)分割是檢測到圖像中的所有目標(biāo),解決“每一個(gè)像素屬于哪個(gè)目標(biāo)物或場景”的問題,屬于像素級(jí)的,需要給出屬于每一類的所有像素點(diǎn),而不是矩形框。實(shí)例分割是目標(biāo)檢測和目標(biāo)分割的結(jié)合,相對(duì)目標(biāo)檢測的邊界框,實(shí)例分割可精確到物體的邊緣,相對(duì)目標(biāo)分割,實(shí)例分割需要標(biāo)注出圖上同一物體的不同個(gè)體。
圖|AI技術(shù)的子領(lǐng)域
圖|計(jì)算機(jī)視覺用于醫(yī)療影像
四、要解決人類指定的各類任務(wù),先要讓計(jì)算機(jī)模擬人類的學(xué)習(xí)機(jī)制
人類跟計(jì)算機(jī)的能力維度各有優(yōu)勢,讓計(jì)算機(jī)學(xué)習(xí)和模擬人類解決問題的方法是各類算法的起點(diǎn)。
人類會(huì)非常容易的辨別出垃圾郵件與貓狗,但是讓計(jì)算機(jī)做卻非常困難,因?yàn)檫@與發(fā)明計(jì)算機(jī)的最初任務(wù)有本質(zhì)區(qū)別。比如對(duì)1億數(shù)據(jù)進(jìn)行混合四則運(yùn)算或大小排序,這些任務(wù)讓人類執(zhí)行會(huì)非常低效,但計(jì)算機(jī)卻可以快速完成,而AI要處理的任務(wù)與計(jì)算機(jī)最初的任務(wù)恰好相反。
這促使人們思考人類的學(xué)習(xí)機(jī)制,理解人類的學(xué)習(xí)機(jī)制,有助于讓AI有效復(fù)刻這種能力機(jī)制。嬰兒根本不知道貓狗到可以一眼分辨出貓狗,是一個(gè)經(jīng)驗(yàn)學(xué)習(xí)過程。首先需要一定的樣本資料,從現(xiàn)實(shí)中獲得大量信息,然后大腦將接受的信息進(jìn)行學(xué)習(xí)、歸納、整理、總結(jié),最后形成知識(shí)與經(jīng)驗(yàn)。計(jì)算機(jī)優(yōu)勢是計(jì)算能力非常強(qiáng),可以處理海量數(shù)據(jù)。需要給計(jì)算機(jī)提供成千上萬的資料數(shù)據(jù)(貓狗照片)讓它進(jìn)行學(xué)習(xí),然后計(jì)算機(jī)再面對(duì)新樣本時(shí)才能以較高的準(zhǔn)確率進(jìn)行分辨。
圖|讓計(jì)算機(jī)模仿人類來解決問題具備理論上的可行性
五、基于AI習(xí)得的能力,AI能處理兩大類任務(wù)
AI處理的根本任務(wù)只有兩類,分類與回歸,人類大腦每日處理的也是分類與回歸問題。分類任務(wù)模型輸出是對(duì)象的所屬類別,數(shù)據(jù)類型是離散數(shù)據(jù),回歸任務(wù)模型輸出的結(jié)果是一個(gè)值,數(shù)據(jù)類型是連續(xù)型數(shù)據(jù)。
分類任務(wù)有二分類和多分類,二分類任務(wù)如貓狗圖像識(shí)別,多分類任務(wù)場景包括下棋與自動(dòng)駕駛等場景。在棋盤上可以落子的個(gè)數(shù)是有限的,所以每一步阿爾法Go要做的就是根據(jù)當(dāng)前已落子信息,預(yù)測出落子在每個(gè)可落子位置的勝率,然后選取勝率最高的位置進(jìn)行落子。自動(dòng)駕駛車輛上裝有多個(gè)攝像頭和傳感器來時(shí)刻監(jiān)視車輛四周的環(huán)境信息,可根據(jù)這些環(huán)境的圖像信息讓它選擇在每種情況下方向盤轉(zhuǎn)動(dòng)多少角度、油門或剎車踩多深來實(shí)現(xiàn)車輛的自動(dòng)行駛。
以網(wǎng)約車出行預(yù)測以及股價(jià)預(yù)測來說明回歸任務(wù),回歸任務(wù)和分類任務(wù)并非嚴(yán)格區(qū)分。網(wǎng)約車出行預(yù)測,可根據(jù)上下車地點(diǎn)、時(shí)間、天氣情況、人流密度以及歷史記錄等因素,預(yù)測此刻某區(qū)域的網(wǎng)約車訂單數(shù),并以此為依據(jù)進(jìn)行車輛調(diào)度,保證供需平衡。股價(jià)預(yù)測可根據(jù)歷史走勢、利弊政策、公司財(cái)報(bào)等因素對(duì)股價(jià)進(jìn)行預(yù)測。分類問題在某種程度上可以看做為一個(gè)回歸問題,比如可以定義若一支股票漲幅會(huì)大于5%,就把它歸為買入類,在-5%至5%之間,就將它歸為持有類,跌幅大于5%的話就將它歸為賣出類。