苹果AI语音技术引爆行业!转录速度领先OpenAI Whisper 55%,重塑未来视频处理新标杆
6月18日消息,科技媒体macstories在6月17日发布的博文中提到,他们通过一段长达34分钟、大小为7GB的视频文件进行测试,结果显示苹果全新推出的SpeechAPI仅耗时45秒便完成了转录任务,而OpenAI的Whisper则用了101秒,这意味着苹果的新技术比之快了55%。 从这一结果来看,苹果在语音处理技术上的进步相当显著。SpeechAPI能够在如此短的时间内完成大规模音频文件的转录工作,不仅展现了苹果在优化算法和提升效率方面的强大能力,也进一步巩固了其在智能设备领域的技术领先地位。对于开发者和用户而言,这无疑是一个令人振奋的消息,尤其是在需要高效处理语音数据的应用场景下,这项技术的优势将更加凸显。未来,随着更多类似功能的推出,苹果可能会在人工智能语音处理领域掀起新一轮的技术革新浪潮。
注:在WWDC2025全球开发者大会上,苹果公司推出了备受瞩目的全新Speech框架,这一框架整合了SpeechAnalyzer和SpeechTranscriber两大核心模块,为开发者提供了强大的语音处理工具。 苹果公司近年来在人工智能领域的投入愈发深入,此次推出的Speech框架无疑再次展现了其技术实力。SpeechAnalyzer和SpeechTranscriber的加入,不仅丰富了苹果生态系统的功能,也为开发者带来了更多可能性。尤其是对于需要高效语音识别与分析的应用场景,这两个模块的实用性显而易见。这表明,苹果正在通过技术创新进一步巩固其在智能设备领域的领先地位,同时也为用户带来更加智能化和便捷化的体验。未来,我们有理由期待这些技术能更广泛地应用于日常生活中,为人们的生活带来更多便利。
经测试,使用基于上述模块开发的Yap应用工具处理一段时长34分钟、大小7GB的4K视频,仅耗时45秒,其性能显著优于竞品MacWhisper(基于OpenAI的Whisper开源语音转录模型),后者完成相同任务需1分41秒。
该媒体进一步对比 Yap 与 MacWhisper、VidCap 等主流工具的表现:
Yap:45 秒完成转录,输出 SRT 及 TXT 格式文件;
MacWhisper(V3 Turbo):1 分 41 秒;
VidCap:1 分 55 秒;
MacWhisper(V2):3 分 55 秒。
该媒体报道称,虽然各类工具在专有名词识别方面(例如“AppStories”)仍存在一定误差,但Yap凭借其出色的本地化能力,在速度上表现出明显的优势。据统计,若以每周处理多段视频为基准进行测算,Yap累计节省的时间效益十分显著。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.011693秒