多发性硬化

首页 » 常识 » 诊断 » Google利用AI协助语言障碍人士,不
TUhjnbcbe - 2025/6/27 19:29:00
北京那有专业治疗白癜风 https://jbk.39.net/yiyuanzaixian/bjzkbdfyy/etbdf/

生活大多数层面都涉及与他人沟通,以及被他人理解。许多人将这视为理所当然,但如果试着想像旁人难以理解我们的说话或表达方式时,这肯定令我们极度不便和沮丧。然而,对数百万中风、肌萎缩性脊髓侧索硬化症(ALS,AmyotrophicLateralSclerosis)、多发性硬化、创伤性脑损伤和帕金森氏症等神经系统疾病而产生语言障碍的人士来说,这是他们每天都必须面对的情况。

为了协助克服这个问题,GoogleAIforSocialGood的ProjectEuphonia团队试着透过AI提高电脑理解各种说话型态的能力,像是较不完整的语句。Google与非营利组织ALS-TDI(美国ALS研究机构)与ALSResidenceInitiative(ALS住宅计划)合作,录下ALS患者的声音;ALS是一种神经退化疾病,会导致患者失去声音与其他随意肌的功能。在和这些组织密切合作的过程中,试着了解ALS患者的沟通需求,并致力于最佳化AI模型,以便让手机和电脑更准确辨识与转录这类患者说出的语句。想了解更多关于与ALS-TDI的合作详情,欢迎参考ClinicalOperations资深总经理MaeveMcNally与ALSTDI首席科学家FernandoVieira分享的部落格文章。

为了达成这个目标,透过Google软体将录下的语音转成声谱图,或以更视觉化的图像方式来呈现声音。接着电脑会用这些经过正确转录的声谱图拿来「训练」系统,以更准确辨识这类非典型的语音。模型设计目前是以具典型ALS相关障碍的英语人士为目标对象,但相信这项研究将可应用到更大范围的族群与不同的语言障碍。

除了提升语音辨识能力,也会训练可侦测声音或手势的个人化模型,且这类模型还可采取相关行动,例如对GoogleHome下达语音指令或传送简讯。这类模型对患有严重残疾且无法说话的人士来说特别有帮助。

以下影片主角是DimitriKanevsky,年幼失聪后才开始学英文,目前是Google的语音研究员。Dimitri使用的是即时转录应用程式,并配备自订语音辨识模型,专门用来辨识他的声音。另一个主角SteveSaling在13年前确诊为ALS,他在影片中不出声即可操作GoogleHome,并在运动赛事时透过脸部表情引导机器发出欢呼声。

Google非常期待看到这个研究带来的影响,同时也需要大众的协助。Google之所以能透过AI工具提升语音辨识的效果,都要靠庞大的语音样本训练模型。如果读者或亲朋好友有上述提到因特殊疾病而说话含糊不清、或让旁人难以理解的问题,可填写这份简短的表单,即可自愿为Google讲出并录制多组词语。除此之外,也非常欢迎读者向Google在这项专案合作的非营利组织捐款或担任志工:ALS-TDI与ALSresidenceinitiative。模型听过的语音样本愈多,就愈有机会取得进展,并且将这些工具应用在透过各种方式沟通的使用者身上。

不需要说话或听到声音,也可用电话沟通

去年,Google软体工程师、LiveRelay开发人员SapirCaduri读到一篇以色列年轻女性在社群媒体发表的文章,是关于那位女性曾交往的听障男友,设法修复家中网路连线的故事。即使网路服务供应商的技术支援人员知道对方是听障人士,却仍然无法透过文字、电子邮件或即时通讯与男友沟通。这名女性提到,这件事让男友深切感到,能独立自主且有足够能力处理这些事的重要性。

这篇文章让SapirCaduri开始思考:如何协助人们在不需实际交谈的情况下接听电话?这个想法催生了研究专案:LiveRelay。

LiveRelay使用装置的语音辨识和文字转语音功能,让使用者能一边输入文字,一边让手机代替使用者与对方交谈。藉由提供即时回覆与预测性的文字输入建议,SmartReply与SmartCompose协助让使用者输入文字的速度能快到让对话进行的速度比拟一般讲电话。

LiveRelay完全在装置执行,因此可确保通话的隐私性。由于LiveRelay可让使用者在电话拨出的语音通话中与另一端的通话者互动,不需行动数据,因此即使另一方以市话来电也可进行。

LiveRelay能在通话中协助无法说话或有听力障碍的人士,并当作现有听障人士服务方案的补充服务,特别是帮助听障使用者。举例来说,美国境内就为听障人士提供无障碍和即时文字转译(RTT)服务。这类服务在某些情况下有优势,Google的目标也并非取代这些系统,而是将LiveRelay当作额外搭配的选用方案,在适当情况下尽可能提供协助,例如接听来电,或是当使用者因隐私考量,希望能使用全自动系统时。

Google对LiveRelay的长期发展十分乐观,相信全体使用者都能因这项服务受惠。相信许多使用者都曾有需要接听重要电话,但无法离开当下手边进行事项的经验。在LiveRelay的帮助下,使用者不必实际与对方交谈,也能随时随地透过输入文字的方式接听电话,甚至可整合即时翻译功能,让使用者能与世界各地的人通话,完全不必担心语言隔阂。这一切可能性都源自无障碍功能的设计初衷。

LiveRelay目前仍处于研究阶段,但Google希望这项服务有朝一日能为使用者提供更多元且优质的沟通方式,对服务资源较为不足的身心障碍人士而言更是如此。

1
查看完整版本: Google利用AI协助语言障碍人士,不