Menu
en 員工版 學術版 患者版
您現在的位置: 首頁 > 健康科普
山世光:從看臉到讀心——深刻理解人的視覺計算技術
時間:2019.12.25
點擊數:
字體:
所屬分類:糖尿病
来源:实习记者 周海若 整理

編者按:2019年12月5日晚,第三期“協和咖啡館”科普沙龍在乐玩彩票平台西單院區咖啡廳舉辦,中科院計算技術研究所研究員、中科院智能信息處理重點實驗室常務副主任山世光作題爲“從看臉到讀心——深刻理解人的視覺計算技術”的科普講座。讓醫務工作者深入了解視覺計算技術的曆史、現狀與未來,探索未來智能醫療的更多可能。

山世光研究員作科普講座

山世光:從看臉到讀心——深刻理解人的視覺計算技術

近年來人工智能(AI)技術高速發展,在科技領域掀起一場風暴,也逐漸重塑著人們的生活。計算機視覺作爲AI主要的、能夠快速落地的技術而備受關注,成爲未來發展的風向口。對于受衆而言,原本遙不可及的智能技術逐漸以“刷臉”等新潮方式落地,滲透進日常生活,不僅帶來了生活方式的更新,還讓人們從中窺探到未來AI發展的無限可能。

AI仍在“幼兒時期”:人工智能的發展簡史與現狀

AI自1956年概念提出,發展至今經曆了“三夏兩冬”。如今,隨著大數據、雲計算等信息技術的發展,深度學習在語音識別、圖像識別、機器翻譯、自然語言理解等經典AI難題上取得突破,大幅跨越了科學與應用之間的“技術鴻溝”。

面对AI强劲的发展势头,社会上不乏有“担忧”的声音出现。事实上,现阶段AI的主要成就集中于专用AI领域,即在执行特定、边界清晰的任务时,在大数据、感受器及深度学习的算法协同作用下,机器“局部”智能水平确可超越人类水平。例如IBM计算机“深蓝”击败国际象棋冠军、Alpha GO战胜围棋冠军、人脸识别等。而真正意义上完备的AI系统,是一个通用的智能系统,如同人脑一样有融会贯通、终身学习、处理各类复杂问题等能力。可以说,目前AI仍存在较大的局限性,呈现出“专才而非通才”“有智商没情商”“会计算而不知‘算计’”的状态。

從人眼到“機器眼”:視覺智能的現狀與趨勢

計算機視覺技術是AI技術的重要分支之一,是使計算機如人類一般通過視覺觀察和理解世界,實現從人眼到“機器眼”轉換背後的技術根基。近年來,視覺智能在視覺識別方面取得突破性的成就,識別愈加精准,在各類日常生活及工作場景中均展現出較高應用價值。

視覺智能可以塑造便捷、豐富的生活場景。道路監控攝像頭通過視頻結構化分析,對人和車輛等物理屬性進行捕捉,並以文本形式記錄及存儲,提高檢索效率;機器通過數據合成,實現“換臉術”,甚至完成“造臉”;通過圖像生成,實現藝術作品的“背景置換”“風格切換”“季節轉換”;以及通過與語言技術“聯姻”,實現包括“看圖說話”在內的交互活動等。

視覺智能可以塑造安全、標准的工業檢測場景,實現高重複性、高風險、高複雜性勞動的眼力替代,不僅提高工作效率,也推動傳統産業進行升級換代。例如在産品質控方面,除對流水線産品進行質量檢測外,視覺技術還可通過缺陷檢測,自動分析無人機傳送的實時電塔照片,代替電力工人進行電塔檢測,實現質量控制;在生産安全方面,視覺技術通過分析員工操作行爲視頻,對其進行規範性檢測,爲實現標准化的生産規範監督管理節省人力等。

目前視覺技術的應用落地主要依賴于高效的數據獲取與標注,計算機算法通過接觸大量數據,建立映射模式,從而進行快速識別。未來視覺智能將會呈現從簡單視覺識別向深度視覺理解發展、從單模態學習向多模態協同學習發展的趨勢,視覺智能應用場景將更多以人機協同的模式呈現。

“世間一切,盡在臉上”:視覺技術的臨床應用

言語及行爲部分可視作個人內在心理和精神的外顯表現。人臉攜有豐富個體信息,視覺智能通過捕捉面部特征所承載的多維信息,包括瞬態特征(身高體重、生命體征、視線等),短期特征(微表情、情緒等),基于大數據及算法進行分析,推斷其精神狀況,甚至人格特質。

國際上已有團隊將視線估計、表情識別、面部動作識別以及數據挖掘等AI分析技術應用于疾病輔助診斷。自閉症兒童早期診斷方面,AI對傳感器記錄下的兒童社交行爲或個體行爲過程進行分析,從而得出受試兒童行爲特征:相較于正常兒童,自閉症兒童具有更關注圖像中心、關注社交信息少的內容、關注非人臉區域、關注局部等行爲特征。

抑郁症輔助診斷方面,AI不僅能基于頭部姿態特征、眼神特征、語音與語言特征進行抑郁症檢測,還可評估抑郁程度,精確度與特異性較高。此外,在壓力分析、疼痛分級及帕金森症的診斷中,視覺智能也具有良好的應用前景。

目前研究人員對于AI的認知還處于“盲人摸象”階段,視覺計算技術可以看作對其“眼睛”這一局部的摸索,而AI全貌還未能完整展現。雖說AI發展還在路上,需要更多的技術探索及深耕,但未來的發展和突破十分值得期待。


图/新华社记者 张玉薇


科普作者
相關科普文章查看更多
了解這些有可能對您的就診有所幫助