活動

CPII與RTHK攜手合作,利用生成式AI及先進AI技術為財政預算案直播提供革新的三語資訊即時摘要

CPII與RTHK攜手合作,利用生成式AI及先進AI技術為財政預算案直播提供革新的三語資訊即時摘要

香港中文大學成立的博智感知互動研究中心 (CPII),與香港電台合作,利用AI技術革新了電視廣播的多語言資訊摘要流程。 通過創新的AI研究與開發,CPII實現了三語語音識別、翻譯、自動錯誤更正和自動信息摘要的無縫集成,實時支援了2月28日財政司司長的預算案演説及隨後新聞發布會的廣播。

此兩項重要活動的廣播,對準確無誤並及時地向公眾傳遞關鍵訊息的要求至高。 借助CPII的創新AI技術,RTHK成功地實現了為觀眾提供即時關鍵資訊的摘要。

CPII人工智慧技術的主要特點包括:

  1. 實時三語語音辨識直播:在現場直播場景下,能夠實時識別流動式語音中的粵語、英語和普通話,即使演講時三種語言之間互相切換,亦可確保無縫識別。
  2. 粵語轉為英語翻譯:自動將已識別的粵語文本翻譯為英文文字,使不同觀眾更容易理解和獲取資訊。
  3. 自動錯誤修正和標點插入:自動修正語音識別文字中的錯誤,並插入適當的標點,以增強內容的可讀性和清晰度。
  4. 生成式AI (generative AI) 摘要:利用生成式AI自動產生簡潔的摘要,重點反映預算案和新聞發布會的關鍵資訊。


在直播期間,CPII的「會議助理技術」支援即時的自動語音轉換文字、摘要和翻譯。 口語音頻被傳送到三語語音辨識引擎進行即時識別並轉錄為文字。 轉錄文字以自動產生的段落出現,可以透過使用生成式AI進行自動摘要。 此外,中文語音轉錄出來的文字也透過CPII的機器翻譯模型自動翻譯成英文。 這些CPII開發的技術旨在簡化廣播中的資訊流程,提高操作效率。

CPII的AI技術也以滾動重點的形式展示了電視直播中的重點。 這種動態的展示形式能為觀眾提供了即時獲取關鍵資訊的途徑,增強了大家對預算報告和新聞發布會內容的理解。

CPII總監蒙美玲教授表示:「我們很榮幸與香港電台合作,提供預算案報告和新聞發布會的技術支援。CPII的AI技術,為觀眾提供了快速獲取關鍵信息的便捷途徑。」

香港電台助理廣播處長(電視及機構業務)陳俊樂女士表示:「採用CPII 的人工智慧技術,標誌著我們對加強重要活動報告方面的一個關鍵里程碑。這些先進AI技術確保我們的觀眾能夠及時、準確地接收到最新,最豐富的信息,進一步推動了我們提供高質量節目的承諾。」

關於CPII:博智感知互動研究中心,由香港中文大學成立, InnoHK計畫資助,是專注於人工智慧的研究中心。 CPII正在進行涵蓋語音與語言智慧、視覺智慧等研究項目,以及開發基於視覺和語言的醫療AI、基於視覺智慧的智慧城市服務,以及AI驅動的智慧製造。 CPII旨在透過創新推動香港及大灣區各行業的數位轉型及發展,為企業和社會帶來更有效率的營運模式和創造更大的價值。

欲了解更多關於CPII的信息,請瀏覽 www.cpii.hk.

聯絡方式:[電子郵件: [email protected]] [電話: +852.3692.6600]