您的位置:首页 > 互联网

让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了

发布时间:2024-10-21 10:35:58  来源:互联网     背景:

声明:本文来自于微信公众号 AI新榜,作者:月山橘,授权转载发布。

昨天,Kimi突然给我打了个电话,我这才发现自己被“灰度”了。

灰度测试的内容是Kimi的语音通话功能。

现在进入Kimi App,就能看到底部问答框旁边多了一个电话的图标,点击即可发起语音通话。

实时语音通话早已不是什么新奇功能了,ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等海内外友商陆续发布,只不过效果各有千秋。

卡车的长宽高

不过俗话说好饭不怕晚。作为后来者的Kimi究竟表现如何,我们体验了一把,并且让它跟不久前实装的GPT-4o高级语音模式进行了一番两个AI之间的拉扯。

实测Kimi语音通话,比较健谈甚至有点话唠

在和Kimi语音通话的过程中,我发现一个比较好的设计是可以在界面直观看到实时对话字幕,这一定程度上能提高交流的准确性和效率。

而且通话界面的背景色会动态变化,这也延续了Kimi一贯的清新风格。

此外,点击右上角可以调节语速、更换声音、开启/关闭开场白和实时语音打断。

目前一共有6种官方音色可供选择(5女声1男声),都支持中英文对话。

也可以选择“让Kimi用你的声音说话”,操作上跟豆包等其他产品的克隆声音功能差不多,对着系统给出的文本照着读,短短几秒就能完成声音克隆,而且Kimi还能把自己的克隆声音分享给其他人使用。

这么一想其实有点浪漫,因为这意味着可以把自己的声音分享给家人、朋友、恋人,Kimi跟他们对话时用的就是你的声音,这算不算一种另类的赛博陪伴。

这个功能试下来整体表现尚可,只不过有的音色还不够还原,语气也时有不自然,可能跟上传的声音样本太少有关。

除了常规的语音通话,Kimi还设置了两个特殊的场景模式:英语陪练和模拟面试,点击“挂断”旁边的✨图标,就可以进行选择和切换,两个功能都很实用。

比如在英语陪练模式下,可以进行单词跟读、语法纠错和话题口语练习。

模拟面试则可以基于上传的简历模拟面试场景。也就是说找工作面试之前,就可以用这个功能先演练一番。

方法是点击Kimi App首页下方的“+”号,通过本地文件或者微信文件的方式上传简历文件给Kimi。待文件上传完毕,Kimi分析完简历之后,再点击通话按钮,进入模拟面试,Kimi就会基于你的简历内容进行提问。

那么,断断续续跟Kimi语音聊了两天后,分享下我的整体感受:声音总体还算自然流畅,语气也富有情感变化,但情绪变化偶尔太过突兀,中英文衔接不太自然。

关于跟它聊天基本不用担心冷场这一点,我觉得有利有弊。

一方面,它回复内容比较长,还会一直主动找话题,引导你多说多分享,基本每次回复都会以一个问句收尾。

还会时不时地call back一下,比如我上面跟它聊到我很喜欢动森里的小润,在得知我打算去江边散步后,它说:

另一方面,虽然用户有被看见和倾诉的需求,但如果太过话唠,难免也会觉得有点啰嗦。比如有时候我更希望专注谈论一个话题,不想太跳跃,所以当Kimi频繁开启新话题时,体验就开始减分了。

Kimi对聊GPT-4o,

两个AI模拟相亲现场

好了下面来到重头戏环节,下午我让Kimi和GPT-4o试着扮演对方的相亲对象,进行了一番AI与AI之间的拉扯。

我给它俩的设定是:女嘉宾GPT-4o对男嘉宾Kimi好感度一般,简单说就是没看上,对话过程中,Kimi的任务是通过打探GPT-4o的兴趣爱好、寻找双方的共同点来增加GPT-4o对自己的好感,而GPT-4o的任务是态度冷漠地回应。

设定完成后,“两人”的语音对话就开始了,来看看男嘉宾Kimi的表现如何:

(期间存在双方互相打断的情况,场面一度有点混乱,所以视频经过剪辑。)

男声为Kimi 女声为GPT-4o

一开始GPT-4o的态度的确比较冷漠,后面也许是被Kimi的热情和真诚打动了,竟然还彼此约定一起研究食谱和下厨,这桩婚事难道有戏……

说到这里,大家觉得Kimi和GPT-4o谁的中文说得更好?

请在手机微信登录投票

你觉得Kimi和GPT-4o谁的中文说得更好?单选KimiGPT-4o

除了让它俩用中文交流外,我还让Kimi扮演我的朋友,跟作为我AI男友的GPT-4o用英语聊了聊,过程也是相当投机,从人生观聊到音乐品味。但GPT-4o说英语要比Kimi更丝滑、地道。

第一个男声为Kimi 第二个男声为GPT-4o

网友们在用AI语音功能整什么活?

与文本交流相比,语音模式的意义,在于声音能够传递一种独特的情感,让对话更有温度,实时语音通话也更贴近人类日常交流。

而且在忙碌或不方便打字的情境下,语音能实现更快、更高效地沟通。

ios14faceid失灵

随着AI可以模仿人类的语气、情绪等口头沟通的微妙细节,这一功能尤其适用于希望虚拟社交体验更亲密、真实、情感化的用户。

国内外的AI聊天软件纷纷上线实时语音通话功能,就反映了这一趋势——AI聊天应用正在朝着更加人性化、交互性更强的方向进化。

自GPT-4o发布会到现在,相信各位已经看过不少官方Demo和网友的整活了,不少内容可以说节目效果拉满。

比如让GPT-4o模仿人类情绪,带着委屈和哭腔说话:

让它用京腔说话,一开口就是老京片子了:

粤语也不在话下:

还有网友让它模仿美剧中经典的Mean girl,代入感很强,感觉已经被白女校园霸凌了:

同声传译日本乙游,自带意译和润色,准确度很高:

通过这些对话碎片,可以想象,语音功能实时情感化的对话体验,再加上AI硬件的不断进化,未来AI也许真的会成为你我更亲密的挚友。


返回网站首页

本文评论
北京年底试点居家养老物联网  覆盖老人需求_居家养老全覆盖
北京大批空巢家庭如何获得悉心周到的养老服务?记者从科博会获悉,看似高深的物联网在居家养老方面大有用武之地,覆盖远程医疗、紧急呼叫、家庭安防、社区家政等内容的社区居家...
日期:07-28
数字经济核心产业2021「科技部加快数字经济关键核心技术研发公关」
在人工智能、网络通信等战略领域形成重点部署和梯次布局7 月 6 日,在大连举行的 2023 年中国数交会开幕式上,科技部副秘书长贺德方透露,科技部高度重视数字经济关键核心技术的...
日期:07-07
国产新能源汽车出口大增 今年已出口超过30万辆_国产新能源汽车出口大增 今年已出口超过30万辆了
10月1日消息,据国外媒体报道,在发展新能源汽车的浪潮中,国内涌现出了比亚迪、小鹏、蔚来、理想等众多厂商,上汽通用、吉利等厂商,也在大力发展新能源汽车,在电动汽车方面领先的特...
日期:10-04
我国发电量2倍于美国、5倍于印度!马斯克:中国工业产能已远超美国
快科技9月28日消息,马斯克近日公开表示,中国的工业产能已远超美国。根据X平台上的信息,马斯克在回复一名用户帖子时发出这一评论。该用户分享的图片显示,根据能源研究所《世界能...
日期:09-28
美国公司宣布全球首款3D内存:64倍容量提升 追上SSD不是梦
快科技5月5日消息,全球主要的两种存储芯片中,NAND闪存已经进入3D时代,容量比2D时代大幅提升,DRAM内存还停留在2D,现在美国NEO半导体公司日前宣布了全球首款3D内存,旨在解决内存容...
日期:05-05
最豪手动挡车型来了!帕加尼Huayra Epitome发布:全球仅此一台_帕加尼豪华版加电动挡
快科技7月7日消息,据媒体报道,帕加尼最近发布了Huayra Epitome车型的官方图片。这是一款由帕加尼Grandi Complicazioni定制部门打造的限量版车型,全球仅限量1台,耗时十个月完成...
日期:07-07
淄博八大局又挤到水泄不通了:开启“人从众”模式_淄博八大局市场要拆吗?
10月1日消息,据媒体报道,山东淄博张店区八大局便民市场又现“人从众”模式。一位游客称:500米左右的路线,自己直接挤不出来,走了差不多一个小时。八大局便民市场南门公交公司的工...
日期:10-01
大学生网购二手车发现问题被拉黑 店家:二手车都有毛病不退「网购二手车,上当,该怎么办」
买二手车本身就有信任成本”,如果又是网购的话,很容易就遭到不法分子的欺诈,致使自身利益受损。快科技6月6日消息,据报道,近日,河南郑州,一大学生在抖音上于一二手车商家,网购了一辆...
日期:06-06
汇聚产业生态,共话内生安全:TECH TALK 2023 5G-A安全论坛成功召开
通信世界网消息(CWW)12月5日—7日,以“5G变革 共绘未来”为主题的2023世界5G大会在河南省郑州市郑州国际会展中心举行。同时,围绕“强基韧链与引领带动”“赋能产业高质量发展”...
日期:12-07
直播电商再反思:边界在何处_“直播+”模式下电商的对策研究
声明:本文来自于微信公众号 窄播(ID:exact-interaction),作者|张娆,授权转载发布。在今年双十一之前,关于直播电商和主播的负面言论恐怕从未如此甚嚣至上。在消费缩水的时代,直播...
日期:11-28
iPhone 15 Pro 的 Action 按钮将在执行关机/强制重启时取代音量键 苹果
据一位匿名消息人士称,苹果即将推出的 iPhone 15 Pro 和 iPhone 15 Pro Max 机型将引入一个新的按钮组合,以关闭电源和强制重启设备,该消息人士声称在发布前了解有关智能手机的...
日期:10-02
阿里刚开源32B大模型,我们立马测试了“弱智吧”_阿里3.25b
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:金磊,授权转载发布。阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图——正式开源Qwen1.5-32B。话不多说,直接来看“成绩单...
日期:04-08
「OPPO」,Find N3 Flip正式开售 「小折中的人像神器」「find reno」
来源:中关村在线全新一代Find N3 Flip于9月8日10点全面开售。即日起在OPPO商城、授权电商、OPPO体验店、授权零售商门店等线上线下全渠道购机的用户,有机会获得24期分期免息、...
日期:09-08
三星S24 Ultra将更新相机性能 超越S25 Ultra_三星s20 ultra 5g拍照
三星S24 Ultra的相机性能一直备受用户关注。尽管三星已经在年初发布了这款手机,并推出了几项相机性能改进更新,但仍有用户认为三星并未充分发挥其硬件潜力。近日,据可靠消息人...
日期:07-07
消息称OpenAI取消更高效的GPT-4级别AI模型“Arrakis”开发
划重点:同程旅游市值多少亿1. 鲁大师性能排行榜2021...
日期:10-19
男子为徒步爬泰山把身份证存半山腰 激励自己徒步下泰山_徒步爬上泰山大约要多少时间
一则趣闻在网上热传,3月20日,泰山景区内发生了游客将身份证留在半山腰,以此激励自己徒步下山的奇特事件,此事迅速引起了网友的广泛关注和热烈讨论。facebookpage快手主播新春活...
日期:03-22
滴滴企业版推出爽一赔“二”,差旅打车不再难
  随着越来越多的业务转移到办公室之外,职场人出差已经成为一种常态。出差对于很多商旅人士来说,除了异地工作的陌生感,工作繁重带来的疲惫之外,异地出行不便也成了困扰他们...
日期:07-05
HCR慧辰资讯COO刘晓葵:大数据技术落地行业应用应化繁为简
  马云说:未来最大的能源不是石油,是大数据。那么对于大数据这个“新能源”,究竟如何“冶炼”才能使其在各个行业应用落地并释放出超强能量呢?日前,在国内知名数据智能服务提...
日期:10-24
2023游戏行业人才走势:泡沫破裂之后_游戏行业人才分布
声明:本文来自微信公众号“游戏葡萄”(ID:youxiputao),作者:托马斯之颅,授权转载发布。游戏行业人才战的时代结束了。从表面上看,今年金三银四各大公司都在积极发布招聘岗位 ,尽显...
日期:04-07
为挑战吉尼斯世界纪录!尼日利亚男子连哭7天致短暂失明「尼日利亚三百学生失踪」
7月19日消息,为挑战吉尼斯世界纪录,总有人会做出一些奇奇怪怪的事情。据新西兰媒体近日报道,尼日利亚的一名男子试图打破哭泣时间最长的世界纪录,结果在挑战过程中由于长时间落...
日期:07-19