第730期【齐悦读—线上共读—透视新科技】《人工喉的魅力》

讲座题目:透视新科技——人工喉的魅力
主 持 人:胜 春
做客嘉宾:牛海军,北京航空航天大学生物与医学工程学院教授。
陈晓红,首都医科大学附属北京同仁医院主任医师。
讲座时间:2025年12月29日~2026年元月4日
(备注:讲座视频可循环播放)
透视新科技——人工喉的魅力
讲座内容:
各位好,欢迎收看我们今天的《透视新科技》!我是主持人胜春。据统计我国每年有十几万人因伤病而失去喉咙,从而导致失去说话的能力。科学界一直在努力研发一项新技术,让这些失去咽喉的人重新开口说话,那这到底是一项什么样的技术呢?我们通过短片来进入今天的节目。家住北京的刘春荣本来热情开朗,爱说爱笑,也爱唱歌,但是突然确诊的喉癌让她的生活彻底发生了改变。2018年2月,刘春荣通过手术摘除了咽喉,病痛虽然解除,但是她的生活又陷入了另一种困境,因为不能说话,刘春荣无法与家人和朋友正常交流,渐渐疏远了热闹的朋友圈。更让刘春荣难以接受的是,她不仅失去了说话的能力,甚至连哭、笑、打喷嚏,都发不出任何声音,家人对她的喜怒情绪甚至病痛都常常无从知晓,无助、恐惧、自卑,种种不良情绪逐渐萌生,让刘春荣几度崩溃,甚至丧失了对生活的希望,直到从医生手里拿到一个小小的电子装置,刘春荣的人生开始重燃希望。我们今天请来的两位嘉宾,一位是北京航空航天大学生物医学工程高精尖中心的牛海军教授,另外一位是首都医科大学附属北京同仁医院的主任医师陈晓红。
其实说到喉癌这样的病例的时候,很多人印象比较深的是当年的我们国家的一个著名的相声演员李文华老师,他患喉癌的事情应该很多人都知道,他患喉癌以后,要把喉整个给它拿掉,拿掉以后他实际上失去的不光是喉,他失去了声带,实际上声带是我们说话的源泉,声音的源泉。作为患者来讲,比如像我在手术以前,我是正常和周围同事和社会是通过语言来进行交流的,但是一旦做完手术以后没有喉了,他等于说和这个世界就阻断了,他想表达,没法表达,尤其是不会写字的人,基本上他和世界就隔阂了。什么样的人会失去咽喉呢?如果是喉部长了有恶性肿瘤的话,在早期我们是可以保留喉,但是在晚期肿瘤的时候,或者对于复发性肿瘤,大部分情况下我们是把喉拿掉,或者是临近(喉)的肿瘤,比如说下咽癌,它侵犯了喉,喉是好的,但是它侵犯范围很大,喉也保不了,或者有的甲状腺癌。那像这样的癌症的发病率如何?比如像喉癌,我们有一个粗略的统计,就是喉癌的发病率目前认为在十万分之八。那么我们可以进行简单的理解是万分之一,万分之一的概率,如果在中国全国我们要折算的话,每年新发的病例大概在11万左右。这么多?
2022年4月,全国肿瘤防治宣传周发布了一则消息,近些年,我国有一种恶性肿瘤的发病率逐渐攀升,它就是喉癌。喉癌的发病原因目前还是一个未解之谜,但是诱发喉癌的原因却有很多,比如长期吸烟、喝酒,不良的口腔卫生习惯等等。喉癌早期的治疗方法可以通过微创手术治愈,而一旦到了晚期,就需要部分或者全部切除咽喉,但是喉癌最大特点之一就是早期的症状并不明显,容易被忽视,所以很多喉癌患者被确诊时往往已经处于晚期,不得不切除咽喉。患了肝癌,可以肝脏移植,包括心脏都可以移植,都可以成功了,那喉可以移植吗?喉是可以移植的,喉最早的移植是1998年,为什么国内外专家再没有在这个领域去继续跟进呢?主要是我们心脏或肝脏,它是人体不可或缺的器官,但是喉来讲,我们做移植它的代价很大,因为我们要终身吃抗排斥(异)的药物,对于患者的生存质量影响是挺大的,所以后来医学努力的方向是放在,比如像我们电子喉的开发,我们临床技术的改进。电子喉研发的初衷一定是看到了很多失去喉咙人的这种痛苦。我们在做这个项目的研究之前,我们也是没有想到喉癌病人有这么多,后来我们通过查阅资料,再跟我们同仁医院等等一些医院的医师、主任去交流,我们才发现原来我们每年发病率有这么高,在十几万的水平上,所以这也是激励我们就是来做这方面的研究,能不能为全喉切除术的患者去给他们造福,让他们能不能恢复发声,所以这也是我们的一个出发点。
原来,我们在没有研究出电子喉时候,我们失去喉咙的病人,怎么来开口说话呢?我们讲这人发生呢?我们可以简单地理解成三个过程,第一个过程要提供动力,就是我们通过胸腔的挤压,把肺脏的气流造成一个高压,这种高压的气流冲击声带。那第二步,我们借助这些气流造成声带振动,当这个振动再传递到空气当中,它就能发出声。第三步要通过舌头、软腭,包括我们的嘴唇,我们就发出音,从声能变成丰富的音,所以我们叫声音。我们通过这个咬字器官的变化就有很多不同的词、词汇就可以出来,我们电子喉它是最快捷地解决发生的问题,除了这个以后,我们最常用的还有两种方法。一种方法,就是通过食道发声,还是发声的三个阶段,它把胃当成了肺,先深吸一口气,这个气流通过腹腔的扩张以后,膈肌的上提之后,把气流通过食道到达胃泡,到了胃泡以后再挤压,这个胃泡的气体通过口腔再出来,引起咽腔黏膜的振动,所以等于用胃来替代了肺,就我们叫食道发声。我们知道娱乐节目有一个腹语,就是主持人到这上面来,我们只看到他(嘴巴不动)实际上声带是不发声的,那食道的发声它要人比较瘦,比较胖的人不行,因为他要中气非常足,他要腹肌或胸腔的配合特别到位,它需要一个训练的过程。第二个就是通过这个食道气管瘘,这种发声它的最大的优点它的气量比较足,因为它是从肺里气量过来的,可以连续说话,可以连续唱歌,这在国外有一个节目无喉患者,他在台上主持了半个小时,大家都不知道,那他的缺点就是声音比较机械。
我记得当年李文华老师患了喉癌之后,接受采访的时候,他会谢谢观众朋友,(声音)会一断一断的,这是为什么?我不知道李文华老师在节目上表现,他是用食道发声,还是用人工喉发声?如果用食道发声,他一次是达不到这么大的一个气量的,那个气量是不够的,所以你听他的声音是断续的。会继续。还有一个就是辅助发声,我们讲人工喉现在是用在食道或气管之间打一个通道,然后摁住这个造瘘口,让肺的气流到达食道,然后再从口腔出来。这个气流经过口腔时候,引起口腔黏膜的一个振动,这个振动就相当于我们声带的振动,所以再配合口齿的变化就能发出一个声音。所以像这种临床技术也很多,但是它是要求医学要多做一个手术,每年要更换这个人工喉,要进行更换,它的费用会比较贵。那个时候还不叫电子喉,叫人工喉。人工喉的研究其实在我们中国古代就有,大概在宋朝,沈括有一个《梦溪笔谈》一本书,那么在《梦溪笔谈》上就谈到过一个设备,过去人把它叫作颡叫子,其中还有这么一个故事,就是有一个人因为不能发声了,当然那时候没有全喉切除了,但是他没有声源了,可能照现在的情况来说,就是他声带不会动了,那么他也就不会发声了。所以有人诬告他,他在大堂上又说不出来,那么后来官员就给了他一个设备,然后他就放到嘴里呢,就能发声,大概能听清楚了他的冤情,所以就得以伸冤,所以这是我们古代的这么一个故事,实际上这就是人工喉的一个原型。
人工喉的雏形?对对,雏形,实际上我们古代人是非常非常聪明的,已经有了这方面的一些理解。但现在的人工喉,实际上我觉得就是从这个基础上来的,把喉整个给它拿掉,拿掉以后失去了声带,我们就想能不能给他补一个声带,当然现在从材料的角度来讲,想再造一个声带植入到人体里面去,我们跟陈主任他们已经交流过,这个还是比较困难的一件事情。因为声音的产生的过程,实际上非常复杂,它受着神经的控制。那么我们后来就想,能不能用一个外部的这么一个设备来代替声源,从外部给他一个声源,然后让他再去恢复发声。因为随着电子技术的发展,人们就是用电子技术的方式设计类似于古代的这种人工喉。我们今天的电子喉是什么样的?它其实就是一个外置的声带,也就是它本身就能发出声音。那它发出声音怎么发呢?实际上就是我们有一个电池里面的发声马达,马达做这种往复的运动,然后就可以产生一种声音。就是我们刚才讲发声的三个阶段,这个电子喉就取代了第一和第二个阶段,所以你只需要口齿做配合就行了。第一阶段是我能出来声音,然后用唇齿之间的变化,来说出字来。对,他只需要口型变化,就像你去拍哑剧,说哑剧,我们有双簧。后面有人说,前面有人不是做口齿的动作吗?后面说话那人相当于电子喉,就抵在这个上面,他就是做动作,这个声音就可以发出来,是这样。
人类的交流有多种方式,肢体语言往往误差较大,文字交流费时冗长,眼神交流则难以表达更丰富的内容。相比较而言,语言对话最直接和准确,也因此成为人类沟通交流的首选。因患病而丧失喉咙,就会陷入沟通交流不畅、被人误解的窘境。如何让罹患喉癌的患者回归正常的生活?享受幸福的人生呢?电子喉咙要涉及到高精尖那么高的程度吗?实际上人可以说是一个比航天器比飞机要更精密的一个仪器,可以这么简单来说,声音的产生的过程,实际上非常复杂,是完全靠着发声器官的配合,我们的唇,我们的齿,我们的舌头,我们的鼻腔和上声道的整个的形状变化来发声的。同时受着这个脑就是我们思维就是我们的神经的影响,我们想让它说什么样声音,然后这神经传导到声带上,声带会通过它的紧张程度,绷的紧张程度来变化它的频率,那同时我们肺部的气流还要冲击。如果声带紧了,那么冲击的时候它的频率就高,声带松了,冲击的时候它频率就低。就像我跟主持人您在说话的时候,我们实际上发出来的声调是抑扬顿挫的,为什么会抑扬顿挫呢?就是我们的声带本身,在随着我们的思维在调节它的频率的变化。
笛子发出声音的过程与人类发声有些类似,人类吹气给予动力,笛膜如声带一样振动发出声音,按在不同笛孔的手指,调节着笛声的声调韵律,就如同人类唇、齿、舌等器官,把声带发出的声音调节成语言。但是,人类的语言要比笛声复杂得多,因为人的声音不仅受唇、齿、舌等器官的影响,还会根据人的情绪波动有所变化。紧张、愤怒、悲伤等情绪通过神经信号传导给声带,就会影响声带的状态。声带或松或紧的变化,都会让它发出的声音截然不同。所以要仿生人类的声带,不仅仅要做出一个差不多的“笛膜”,还要抓住人不同的神经信号,这并不是一件容易的事情。这个电子喉具体使用的方法是什么样的?实际上现在的电子喉,也有好多种类,其中最简单的,实际上它就类似于一个这么大一个手电筒的这么一个东西。是在身体外挂?对,在身体外,就是我可以拿一个,咱们看一下,就是大概类似于这么小的一个手电筒一样的东西,直接就顶在这个喉切除患者的脖子上,然后它就可以产生一个声音,这个声音就可以传到患者的口腔内去,然后患者对口型就可以发出自己需要的语言来,所以它使用起来实际上是非常方便的,但是我使用不好,因为这个需要训练。
训练的是什么?因为他过去发声的时候,他是一个无意识的状态,他想说他就说了,因为声带从小就已经训练好了,但是他现在没有声带了,他这个声源如何和他所要说的话来配合,就是口腔的运动来配合,这是一个非常关键的事情。有的人光顶到这儿,但他因为他喉切除了以后,他本来就发不出声音来了,他也不知道如何去对口型,他也不知道自己发出的声音到底怎么样,所以要经过一定程度的训练,如何使得电子喉的声源和他的发声的器官的协调更好。经过自体人机的长时间的配合之后,会让你的语言更精准的。电子喉它最早出现于美国,但是国外的电子喉,它一般没有频率变化,就是一个单一频率。也就是说它可以传递信息,但是情感就会弱化一些。它关键还不仅仅是情感,因为国外的英语,你比如咱们说语言,咱们说speech语音,它speech,它是靠s-p-e-e-c-h,Speech你只要能听到这几个发音因素,就可以理解它的意思。但中国话语不是,中国的语言呢?你像ma这四个声音是完全不一样的。你如果没有频率变化的话,你这四个声音,四个完全就都是ma,都是一声,你就没有二声、三声和四声,所以国内对它的频率的变化有很大的要求。那这不是对我们的研发者提出了更高的要求?对,所以我们要做的事情,就是如何使得这个电子人工喉它的频率变化更丰富,能说出我们汉语普通话的这种声调来,否则我们听他讲话的时候就比较困难,再一个也就比较难以理解,如果有了声调,那就非常丰富了,而且就像您说的,可以带上他个人的一些情感信息了。
现在能做到了吗?现在能做到一部分。一部分是怎么理解?电子人喉其实它的核心还是在仿我们的声带,声带的振动,那仿声带振动呢,实际上是防两个方面的东西,第一仿声带振动的这个波形,第二仿振动的这个频率。那么振动的频率核心问题呢,还是就是我们的神经控制的问题。如果能把神经控制的问题解决好的话,那么这个仿声就能做得更好,因为电子喉的这个频率调控,就是它的声调的调控,是一个非常复杂的一个过程。如果完全要做到这种变频,我们就必须了解清楚它的发声的神经机制,我们把这个神经信号如果能拿到,然后用它再反过来再控制我们的电子喉的频率变化,那就能做到实时的变化,但实际上这个是一个非常困难的事情,神经信号的获取和它的解码是非常困难的一个事情,所以现在还做不到这一点。那今天我们这个电子喉应用起来如何?电子喉还是它容易学得快,非常方便,在短时间内能给他提供一个重新开启或这个社会交流的这种渠道,对于他来讲这是非常意义重大的。电子喉到现在为止,我可以把它大概归结为三代产品,第一代它没有频率变化的,比较适用于西方语言的那种,第二代就有频率变化,但是频率变化并不是很丰富,像西方语言里面,就西方的电子喉它现在设计的有高低频两个频率变化,现在完全就能满足他们的说话习惯了,但是就满足不了我们汉语普通话,所以第三代我们已经做出来能产生四种不同声调的这种电子喉了。当然未来呢,我们可能要使得这个频率变化更丰富,甚至于广东话有七八个声调的这种话,我们也能给它说出来。
用自己的方言讲话更舒服、更亲切,现在的电子喉的功能有可能升级到这样一个程度吗?实际上电子喉的这个发声和方言关系不是特别地密切,因为某一个地方的方言,一方面当然跟我们的声源有一点关系,但是关系不是特别大,它主要的方言还是靠着我们上声道,就是靠着我们唇齿、舌、鼻腔、口腔的配合,来变化它的声调。如果这个电子喉做好了,他用电子喉的时候,他照样能说出四川话来,照样能说出云南话来,照样能说出他的方言来。是这样的,取决于你的原始发声的,口唇之间的变化。我们的电子喉在临床应用上有没有副作用?这个产品基本上认为它没有什么副作用,非常安全。大家好!我是刘春荣,我可以说话了,我非常开心。一个小小的电子咽喉,让对生活几乎绝望的刘春荣,重新燃起了对生活的渴望,利用现代电子技术,新的电子喉实现了对人类声带在频率上的仿制。电子喉发出的声音,因此拥有了更丰富的频率变化,更加与人的声音相似,但是要想让电子喉的声音真正地与人声一样,甚至做到每个人都找回自己原有的个性声音,还有一段很长的路要走。那目前在电子喉研发的过程当中,限制我们发展的技术瓶颈出现在哪些方面?
主要还是频率的变化的调制,就是如何使这个频率变化更丰富。我们想让这个频率变化更丰富,我们就要想很多很多的办法,实际上最根本的是要解码出来,我们的神经到底是如何调控这个声带的?神经信号跟声带的这个振动的频率的高低到底之间有什么样的一个关系?当然这属于基础研究的一个范围了。我们只有把基础研究神经信号的解码做好了,我们可能才能更高一步地提高我们将来电子喉的这个质量。目前的技术不能够做到女生和男生的区别吗?目前做不到。这是为什么呢?因为这个声源是外置的一个声源,因为这外置声源,要进到口腔里面,那首先要经过颈部组织的这个皮肤,然后进去和组织。而人体的这个组织,用学名来说,它是一个对于声音来说,它是一个低通滤波器,就是低频的声音它容易通过,高频的声音就被滤除了,所以我就是给它一个高频的声音,它经过了这个组织以后,从嘴里出来的又变成一个低频的声音了,一般大概就是在八十到一百五十赫兹了等等这个范围,而女生的一般都三、四百赫兹的这种高频声音。而恰恰我们这个组织能把那个高频给滤掉了,所以特别是女性用电头喉的时候,她说出的话有可能很粗、很低沉,所以就有点像男声。还有一个心理重建的过程,比如像以前你是个歌唱家或者是个老师,你的声音悦耳动听,但是机器出来的声音不是他自己原来的声音,很多人他不愿意说,他有一个心理重建的过程。我们这个电子喉除了帮助失去喉咙的人之外,会给普通人带来什么好处呢?
我举一个最简单的例子,大家就能想象,我们可以看到在电视上有一个人插管了,在ICU插管了,插管了没法说话,他要去表达,这时候实际上他把这个电子喉往上放,他是可以说的,特别是做完气管切开的,他没法说这个手都是可以动的,所以这些场景都可以用到电子喉。那从未来的角度来讲,我们研发的未来电子喉这个技术,它的应用前景还有哪些,可以让我们去畅想的?其实这个仿生技术在我们现在的科学研究里面是无处不在,真的是无处不在,像我们北航在做的好多飞行器等等,这些其实都是在仿一些昆虫或鸟等等它的飞行方式,我们电子喉同样是仿声带的振动,实际上核心问题,还是我刚才所说的神经调控的问题。如果这个神经调控做得好,它就仿得好,那么它所涉及到这个相关技术,在其他的医疗领域都能应用到,我们的人工器官,我们的人工肺靠着神经的这个调控。还有一个就是为将来的机器人的发展,会带来很多很多的方便之处,因为我们现在机器人也是采用的是合成技术,它嘴一张一闭,一张一闭,它说的话和它的嘴形,和它整个的这个声道是没有关系的,我们讲如果能基于发声器官的,语音重建技术能做得更好的话,那么它就完全靠着自己的嘴形或者是自己的这个口腔的变化就能发出声音来。陈先生在临床有丰富的经验,比如说这种仿生的技术会对我们临床未来的耳鼻喉,甚至其他的人体器官,替代有启发吗?
作为临床来讲,我们作为应用的终端,我希望未来可能有三个方面的变化,一个方面的变化,就是刚才牛教授反复强调的我们汉语它本身固有的特征,它是要四个语调,把语调能够在人工喉上再现。我觉得这一点,未来可能要结合电生理,它是一个复合医学和医工结合的一个课题,可能要(有)漫长的一段路要走。第二个就是我们希望能再现个性化的声音,个性化的声音就是我是我的声音,你是你的,你的声音很悦耳主持人,但我们的声音可能是另外一种声音,歌唱家是歌唱家的声音。就还原你本真的声音?所以我们现在做的和牛教授我们课题做了一个工作,每一个到我们科治疗的人,我们都要把他声带没有发病的以前的声音录一段声音,生成指纹,作为指纹库,每人指纹库做起来,未来牛教授他的技术发展了,我们可以直接模仿他的真声,所以这是未来我们提供个性化的一个服务。第三个我们知道现在人工智能非常多,有一种术叫唇读,看嘴唇我就知道你要说什么话。如果未来通过我说话,我说一二三四五,我的嘴形提前录出来,如果解读好,然后再把我的嘴唇以后说话,它会有快速这种组合通过晨读的方式,可能通过类似于人工喉把这个声音解码出来,我们希望这种可能是更高级的,你只要动动口型,这个声音后台就出来了,这是我们想未来从临床上,我们的医工提出很多这些要求,希望这个能够满足患者的要求。感谢您收看我今天的《透视新科技》节目!如果您想了解我们更多的节目内容,可以下载央视频收看我们过往的节目,我是胜春,咱们下期节目再见。
