定義
人機(jī)交互技術(shù)包括機(jī)器通過輸出或顯示設(shè)備給人提供大量有關(guān)信息及提示請示等,人通過輸入設(shè)備給機(jī)器輸入有關(guān)信息,回答問題及提示請示等。人機(jī)交互技術(shù)是計(jì)算機(jī)用戶界面設(shè)計(jì)中的重要內(nèi)容之一。它與認(rèn)知學(xué)、人機(jī)工程學(xué)、心理學(xué)等學(xué)科領(lǐng)域有密切的聯(lián)系。
也指通過電極將神經(jīng)信號與電子信號互相聯(lián)系,達(dá)到人腦與電腦互相溝通的技術(shù),可以預(yù)見,電腦甚至可以在未來成為一種媒介,達(dá)到人腦與人腦意識之間的交流,即心靈感應(yīng)。
發(fā)展歷史
市場需求是很大的,而供應(yīng)方面卻略顯不足,尤其是擁有核心知識產(chǎn)權(quán),技術(shù)過硬的企業(yè)并不多,行業(yè)整體缺乏品牌效應(yīng)。
?、盬IMP界面的形成
Xerox Palo研究中心于70年代中后期研制出原型機(jī)Star,形成了以窗口(Windows)、菜單(Menu)、圖符(Icons)和指示裝置(Pointing Devices)為基礎(chǔ)的圖形用戶界面,也稱WIMP界面。
Apple最先采用了這種圖形界面,斯坦福研究所60年代的發(fā)展計(jì)劃也對WIMP界面的發(fā)展產(chǎn)生了重要的影響。該計(jì)劃強(qiáng)調(diào)增強(qiáng)人的智能,把人而不是技術(shù)放在了人機(jī)交互的中心位置。該計(jì)劃的結(jié)果導(dǎo)致了許多硬件的發(fā)明,眾所周知的鼠標(biāo)就是其中之一。
?、瞁IMP界面面臨的問題和發(fā)展多媒體計(jì)算機(jī)和VR系統(tǒng)的出現(xiàn),改變了人與計(jì)算機(jī)通信的方式和要求,使人機(jī)交互發(fā)生了很大的變化。在多媒體系統(tǒng)中繼續(xù)采用WIMP界面有其內(nèi)在的缺陷:隨著多媒體軟硬件技術(shù)的發(fā)展,在人機(jī)交互界面中計(jì)算機(jī)可以使用多種媒體,而用戶只能同時用一個交互通道進(jìn)行交互因而從計(jì)算機(jī)到用戶的通信帶寬要比從用戶到計(jì)算機(jī)的大得多,這是一種不平衡的人-計(jì)算機(jī)交互。
虛擬現(xiàn)實(shí)技術(shù)除了要求有高度自然的三維人機(jī)交互技術(shù)外,由于受交互裝置和交互環(huán)境的影響,不可能也不必要對用戶的輸入做精確的測量,而是一種非精確的人機(jī)交互。三維人機(jī)交互技術(shù)在科學(xué)計(jì)算可視化和三維CAD系統(tǒng)中占有重要的地位?;赪IMP技術(shù)的圖形用戶界面,從本質(zhì)上講,是一種二維交互技術(shù),不具有三維直接操作的能力。要從根本上改變這種不平衡的通信,人機(jī)交互技術(shù)的發(fā)展必須適應(yīng)從精確交互向非精確交互、從單通道交互向多通道交互以及從二維交互向三維交互的轉(zhuǎn)變,發(fā)展用戶與計(jì)算機(jī)之間快速、低耗的多通道界面。從右上表可以看出在計(jì)算機(jī)系統(tǒng)不同的發(fā)展階段中,人機(jī)交互模型的發(fā)展過程。在傳統(tǒng)的人機(jī)系統(tǒng)中,人被認(rèn)為是操作員,只是對機(jī)器進(jìn)行操作,而無真正的交互活動。在計(jì)算機(jī)系統(tǒng)中人還是被稱為用戶。只有在VR系統(tǒng)中的人才,是主動的參與者。
人類生活中的事件都是多通道的,人-計(jì)算機(jī)多通道交互技術(shù)的發(fā)展雖然受到軟件和硬件的限制,但至少要滿足兩個條件:其一,多通道整合,不同通道的結(jié)合對用戶的體驗(yàn)是十分重要的;其二,在交互中容許用戶產(chǎn)生含糊和不精確的輸入。
⒈非精確的交互
· 語音(Voice) 主要以語音識別為基礎(chǔ),但不強(qiáng)調(diào)很高的識別率,而是借助其它通道的約束進(jìn)行交互。
姿勢(Gesture) 主要利用數(shù)據(jù)手套、數(shù)據(jù)服裝等裝置,對手和身體的運(yùn)動進(jìn)行跟蹤,完成自然的人機(jī)交互。
頭部跟蹤(HeadTracking)主要利用電磁、超聲波等方法,通過對頭部的運(yùn)動進(jìn)行定位交互。
視覺跟蹤(Eye-Tracking)對眼睛運(yùn)動過程進(jìn)行定位的交互方式。
?、捕嗤ǖ澜换サ捏w系結(jié)構(gòu)
多通道交互的體系結(jié)構(gòu)首先要能保證對多種非精確的交互通道進(jìn)行綜合,使多通道交互存在于一個統(tǒng)一的用戶界面之中,同時,還要保證這種通道的綜合在交互過程中的任何時候都能進(jìn)行。圖1和圖2表示了這兩種不同的體系結(jié)構(gòu)。良好的體系結(jié)構(gòu)應(yīng)能保證多個通道的綜合不只是發(fā)生在應(yīng)用程序這一級。
人機(jī)交互技術(shù)是目前用戶界面研究中發(fā)展得最快的領(lǐng)域之一,對此,各國都十分重視。美國在國家關(guān)鍵技術(shù)中,將人機(jī)界面列為信息技術(shù)中與軟件和計(jì)算機(jī)并列的六項(xiàng)關(guān)鍵技術(shù)之一,并稱其為"對計(jì)算機(jī)工業(yè)有著突出的重要性,對其它工業(yè)也是很重要的"。在美國國防關(guān)鍵技術(shù)中,人機(jī)界面不僅是軟件技術(shù)中的重要內(nèi)容之一,而且是與計(jì)算機(jī)和軟件技術(shù)并列的11項(xiàng)關(guān)鍵技術(shù)之一。歐共體的歐洲信息技術(shù)研究與發(fā)展戰(zhàn)略計(jì)劃(ESPRIT)還專門設(shè)立了用戶界面技術(shù)項(xiàng) 目,其中包括多通道人機(jī)交互界面(MultiModal Interface for Man-MachineInterfa
ce)。保持在這一領(lǐng)域中的領(lǐng)先,對整個智能計(jì)算機(jī)系統(tǒng)是至關(guān)重要的。我們可以以發(fā)展新的人機(jī)界面交互技術(shù)為基礎(chǔ),帶動和引導(dǎo)相關(guān)的軟硬件技術(shù)的發(fā)展,使更有效地使用計(jì)算機(jī)的計(jì)算處理能力成為可能。
研究現(xiàn)狀
已經(jīng)取得了不少研究成果,不少產(chǎn)品已經(jīng)問世。側(cè)重多媒體技術(shù)的有:觸摸式顯示屏實(shí)現(xiàn)的“桌面”計(jì)算機(jī),能夠隨意折疊的柔性顯示屏制造的電子書,從電影院搬進(jìn)客廳指日可待的3D顯示器,使用紅綠藍(lán)光激光二極管的視網(wǎng)膜成像顯示器;側(cè)重多通道技術(shù)的有:“漢王筆”手寫漢字識別系統(tǒng),結(jié)合在微軟的Tablet PC 操作系統(tǒng)中數(shù)字墨水技術(shù),廣泛應(yīng)用于Office/XP的中文版等辦公、應(yīng)用軟件中的IBM/Via Voice連續(xù)中文語音識別系統(tǒng),輸入設(shè)備為攝像機(jī)、圖像采集卡的手勢識別技術(shù),以IPHONE手機(jī)為代表的可支持更復(fù)雜的姿勢識別的多觸點(diǎn)式觸摸屏技術(shù),以及IPHONE中基于傳感器的捕捉用戶意圖的隱式輸入技術(shù)。
人機(jī)交互技術(shù)領(lǐng)域熱點(diǎn)技術(shù)的應(yīng)用潛力已經(jīng)開始展現(xiàn),比如智能手機(jī)配備的地理空間跟蹤技術(shù),應(yīng)用于可穿戴式計(jì)算機(jī)、隱身技術(shù)、浸入式游戲等的動作識別技術(shù),應(yīng)用于虛擬現(xiàn)實(shí)、遙控機(jī)器人及遠(yuǎn)程醫(yī)療等的觸覺交互技術(shù),應(yīng)用于呼叫路由、家庭自動化及語音撥號等場合的語音識別技術(shù),對于有語言障礙的人士的無聲語音識別,應(yīng)用于廣告、網(wǎng)站、產(chǎn)品目錄、雜志效用測試的眼動跟蹤技術(shù),針對有語言和行動障礙人開發(fā)的“意念輪椅”采用的基于腦電波的人機(jī)界面技術(shù)等。熱點(diǎn)技術(shù)的應(yīng)用開發(fā)是機(jī)遇也是挑戰(zhàn),基于視覺的手勢識別率低,實(shí)時性差,需要研究各種算法來改善識別的精度和速度,眼睛虹膜、掌紋、筆跡、步態(tài)、語音、唇讀、人臉、DNA等人類特征的研發(fā)應(yīng)用也正受到關(guān)注, 多通道的整合也是人機(jī)交互的熱點(diǎn),另外,與“無所不在的計(jì)算”、“云計(jì)算”等相關(guān)技術(shù)的融合與促進(jìn)也需要繼續(xù)探索。
主要特點(diǎn)
多媒體系統(tǒng)的交互特點(diǎn)
與傳統(tǒng)用戶界面相比,引入了視頻和音頻之后的多媒體用戶界面,最重要的變化就是界面不再是一個靜態(tài)界面,而是一個與時間有關(guān)的時變媒體界面。
人類使用語言和其它時變媒體(如姿勢)的方式完全不同于其它媒體。從向用戶呈現(xiàn)的信息來講,時變媒體主要是順序呈現(xiàn)的,而我們通常熟悉的視覺媒體(文本和圖形)通常是同時呈現(xiàn)的。在傳統(tǒng)的靜止界面中,用戶或是從一系列選項(xiàng)中進(jìn)行選擇(明確的界面通信成分),或是用可再認(rèn)的方式進(jìn)行交互(隱含的界面通信成分)。在時變媒體的用戶界面中,所有選項(xiàng)和文件必須順序呈現(xiàn)。由于媒體帶寬和人的注意力的限制,在時變媒體中,用戶不僅要控制呈現(xiàn)信息的內(nèi)容,也必須控制何時呈現(xiàn)和如何呈現(xiàn)。
VR系統(tǒng)中人機(jī)交互的特點(diǎn)
人機(jī)交互可以說是VR系統(tǒng)的核心,因而,VR系統(tǒng)中人機(jī)交互的特點(diǎn)是所有軟硬件設(shè)計(jì)的基礎(chǔ)。其特點(diǎn)如下:
觀察點(diǎn)(Viewpoint) 是用戶做觀察的起點(diǎn)。
導(dǎo)航(Navigation) 是指用戶改變觀察點(diǎn)的能力。
操作(Manipulation)是指用戶對其周圍對象起作用的能力。
臨境(Immersion) 是指用戶身臨其境的感覺,這在VR系統(tǒng)中越來越重要。
VR系統(tǒng)中人機(jī)交互若要具備這些特點(diǎn),就需要發(fā)展新的交互裝置,其中包括三維空間定位裝置、語言理解、視覺跟蹤、頭部跟蹤和姿勢識別等。
多媒體與VR系統(tǒng)的人機(jī)交互有著某些共同特點(diǎn)。首先,它們都是使用多個感覺通道,如視覺和聽覺;其次,它們都是時變媒體。
內(nèi)容來自百科網(wǎng)