從GUI到AUI:清聽聲學如何用聲音重塑人機交互
日期:2026-04-02 15:39:26 發布者:本站
在計算機發展的每一個階段,人機交互方式的變化,往往決定了技術演進的方向!
早期計算機依賴命令行(CLI),用戶需通過復雜指令與機器溝通。隨后,圖形用戶界面(GUI)的出現,讓人們通過窗口、圖標和菜單完成操作,極大降低技術門檻。幾十年來,GUI 一直是智能終端最核心的人機交互方式。
但隨著人工智能與空間計算時代的到來,這一模式正在迎來新的變化。
當設備數量越來越多、屏幕越來越分散、計算能力越來越強,人機交互重心正在從“視覺界面”轉向“自然交互”,在這樣的時代背景下,一種新的交互范式正在出現——AUI(Audio User Interface,聲學用戶界面)。

AUI概念由清聽聲學率先提出。它不是簡單的語音控制升級,而是代表一種以聲音為核心媒介的人機交互方式,通過全球領先的定向聲技術與AI無感拾音技術,讓設備精準發聲、準確聆聽,并圍繞聲音完成交互閉環。
如果說 GUI 是“用眼睛操作設備”,那么 AUI 則是讓聲音成為新的交互入口。
AUI的三大交互變革
AUI的核心是:讓聲音像光線一樣可控,讓交互像對話一樣自然。
在GUI時代,聲音是附屬品,是提示音、是背景音樂、是嘈雜環境里的干擾項。在AUI框架下,聲音則成為主界面,它具備空間指向性、內容私密性、交互雙向性三大特征。

從點擊界面,到指向聲場
借助定向聲場技術,AUI讓聲音擁有“空間指向性”,聲音不再是無差別擴散的背景噪音,而是精準抵達特定用戶的私密指令,實現“指哪響哪,誰需誰聽”。
從看屏操作,到聽場交互
AUI解放用戶雙眼,在AUI構建的場景中,聲音承載了位置、距離、身份等信息,人機交互從“視覺獨占”轉向“多模態感知”,讓交互回歸人類本能,即傾聽與對話。
從設備界面,到空間界面
GUI是封閉的,而AUI是開放的,它將整個物理空間轉化為交互界面,無論是公共自助服務機上私密的語音交互,還是公共場所的隔聲降噪,AUI讓聲音與公共環境和諧共存。

AUI的核心技術引擎
AUI的真正突破,在于構建“說”和“聽”的完整閉環。清聽聲學的核心技術布局不止于發聲,更延伸至空間互語音交互,通過定向發聲+AI無感拾音雙定向語音交互方案,構成AUI的引擎架構。
定向發聲技術,解決“聽得清”的問題,通過對發聲方向和角度的動態控制,創建專屬的個人聲場和空間音效,確保聲音僅在特定區域內傳播,這意味著在一個開放空間中,聲音可以被定向到特定的人群或目標區域,而不影響周圍的其他人或設備。例如,在公共服務終端,客戶可以清楚地聽到機器的提示音,而不受周圍噪音干擾。
AI無感拾音技術,則解決“說的清”和“聽得懂”的問題,通過多個內置MEMS麥克風,精準捕捉人聲,搭載AI算法,有效實現AI回聲消除和噪音抑制等功能,聲音傳輸更清晰保真;采用高效的音頻處理技術,實現超低延時性能,確保語音實時清晰傳輸,讓每一次溝通都更加自然流暢且無重音干擾。

在 GUI 時代,交互圍繞“屏幕界面”展開,而在 AUI 時代,交互開始進入真實空間。通過將定向發聲與定向拾音結合,清聽聲學創造性地提供一種無干擾、高效且精準的音頻交互解決方案,形成“說與聽”完整、私密且高效的交互閉環。在AUI框架下,用戶無需學習界面邏輯,無需適應設備特性,只需以最自然的語音方式表達意圖,系統即可在專屬聲場內完成精準響應,不僅提升使用體驗,還最大程度減少環境噪音干擾,適應日益復雜的現代工作與生活環境。
AUI的產業實踐
從 GUI 到 AUI,并不是實驗室里的概念演進,而是一種正在發生的產業實踐。GUI 解決的是“如何操作設備”,而 AUI 關注的是“人與設備如何自然溝通”。清聽聲學基于定向發聲+定向拾音雙定向語音交互方案,已在多個真實場景中實現 AUI 的規?;瘧?。
自助服務終端
在銀行、政務大廳、醫院掛號等自助服務場景,清聽聲學定向發聲技術將操作指引與語音播報精準鎖定用戶,鄰位辦理者互不干擾,開放式大廳也可獲得私密交互體驗。搭載AI語音助手交互終端,通過定向拾音技術精準捕捉用戶指令,即使在背景嘈雜環境,系統仍能清晰識別、即時響應,用戶無需俯身湊近、無需刻意提高音量重復指令,即可自然完成業務辦理。

博物館與科技館
在博物館或科技館等展覽空間,清聽聲學定向發聲技術能夠將展品解說精準地傳遞至特定位置,而不影響其他游客的參觀體驗,搭載AI 數字人的交互大屏,通過定向拾音技術可在游客與數字人之間實現高效對話,避免背景噪音干擾,有效提升互動體驗。

開放式辦公場景
在開放式辦公環境中,噪音往往成為員工專注工作和溝通的障礙。清聽聲學定向發聲技術能夠精準傳遞語音信息,減少辦公室內不同工位之間的聲音干擾;同時,定向拾音技術能夠確保語音指令或會議記錄的準確捕捉,提升工作及溝通效率。

AUI的提出者,為什么是清聽聲學?
從 GUI 到 AUI,并不是簡單的技術升級,而是一種交互范式的演進。然而,提出新的交互范式,需要的不僅是概念,更需要長期技術積累與產業實踐的支撐。
清聽聲學成立于2015年,是中國科學院聲學研究所產業化平臺,國家級專精特新“小巨人”企業、國家高新技術企業。十余年來,公司始終專注于定向聲學技術創新,并推動其從實驗室走向大規模商業應用。

截至目前,清聽聲學已完成定向聲技術的三次關鍵技術迭代,累計擁有450+項知識產權與250+項核心技術專利,并建成全球首條聚音屏柔性中試產線。從定向聲技術發明、產品工程化,到規模化商業落地,清聽聲學構建完整的技術體系與產業能力。

當行業仍然圍繞屏幕參數和觸控體驗展開競爭時,清聽聲學已經率先完成顯示技術與聲學技術的深度融合——讓屏幕不僅可以“看見”,更可以“發聲”。這不是功能疊加,而是交互結構的重構。
正是基于這一持續的技術創新與產業實踐,清聽聲學率先提出AUI(聲學用戶界面) 概念,這是一種對未來人機交互形態的前瞻判斷。當交互從“屏幕界面”走向“空間聲場”,AUI 正在成為連接人與智能世界的重要入口。
AUI的提出,是技術突破的水到渠成,更是清聽聲學對產業未來的先行布局。