从 YouTube 视频中提取自动字幕

2022-08-30 15:45:12

我在从 YouTube 视频中提取自动字幕时遇到问题。

我尝试使用 http://video.google.com/timedtext?type=track&v=3wszM2SA12E&name=Automatic&lang=en 方法,但该方法仅适用于那些具有命名曲目的视频。例如,这个没有任何命名的曲目(只有自动字幕),并且不会加载:rrkrvAUbU9Y

有几种Web应用程序可以做到这一点(如 http://www.serpsite.com/youtube-subtitles-download-tool/http://mo.dbxdb.com/),但我需要一个脚本,因为我想用它来进行研究。

任何人都有任何想法,什么是正确的方法得到这个?YouTube的API有一些关于字幕的东西,但仅适用于注册用户,而上面的应用程序适用于所有视频,我怀疑它们只是从页面中捕获html代码(尽管这也是可能的)。一定有办法...请帮忙!


答案 1

以下是我花了一些时间后的建议:


答案 2

您需要先调用另一个 API:http://video.google.com/timedtext?type=list&v=3wszM2SA12E

这将为您提供可用曲目的列表。在您的情况下,只能获得一个轨道:id="0" name="Automatic" lang_code="en" lang_original="English" lang_translated="English" lang_default="true"

在这个特定的视频中,我可以按名称获得曲目:name=Automatic

https://video.google.com/timedtext?type=track&v=3wszM2SA12E&name=Automatic&lang=en

但是对于另一个视频工作正常:id=

http://video.google.com/timedtext?type=track&v=zenMEj0cAC4&id=0&lang=en


推荐