More to Read
2026 May 04
See all posts
第一次听《More to
Read》这个节目,是在某天早晨。6点40多,随便打开收音机,里面传来用中英文双语播讲的《老人与海》,马上被播音员的声音和配乐深深吸引住,节目制作得可以用精美来形容,从此就喜欢上了。6点多是给孩子做早饭的时间,不可能每天准时听,于是又下载了"云听"这个App来听回放,到后来连回放也没有时间听,时间就一天天过去了,这就是成年人的真实生活吧。
到后来就是去年12月份,整台的节目都停播了,于是赶在元旦前的最后一天,把所有音频都下载下来,从2022-04-28到2025-12-22共1335篇,54.1G。云听app里下载下来的文件名是无意义的时间戳,于是想着快点把音频的文件名整理出来。结果马上就是元旦后工作变动,告别之前的GPU集群。从此与世隔绝,真是一丁点属于自己的时间都没有了。
终于在4月28号,排除万难,先从https://build.nvidia.com里申请了whisper-large-v3的免费额度,把字幕弄出来,结果只能说是勉强可用。于是又借用翻译界最强大的Gemini模型,为了省钱,用的是gemini-3-flash-preview进行了校对,整个过程中用claude-sonnet-4-6进行工具编写和网页编写,一切都是为了省token,终于在2026-05-03完工。在手机上把玩许久,非常满意。这么简单的一件事情,搁以前一两天就干完了,居然花了4个月才办成,令人唏嘘。
来感受下Gemini恐怖的翻译能力,节选自它生成的勘误表,比人聪明和渊博多了:
14266451429860605.txt
| Two Door Cinema Club |
Tudor Cinema Club |
近音修正,乐队名为 Two Door Cinema Club |
| The Connors |
The Corrs |
近音修正,著名乐队 The Corrs(可儿家族) |
| EZFM |
Easy FM |
规范台名拼写 |
| 沈厅/沈听 |
沈汀 |
主持人姓名修正 |
| Palermo |
Palmer |
依据上下文 Samuel Palmer 修正 |
| writings |
etchings |
Samuel Palmer 以蚀刻画(etchings)闻名,且下文提到版画家协会 |
| Grand Duchy of the Grand Duchy... |
exhibited his works |
删除识别出的重复和幻觉片段,大英博物馆曾展出其作品 |
| I have come to you delighted... |
修正英文诗歌分段和标点 |
提升阅读体验 |
| 念希 |
念希 |
Easy FM 主持人名,此处正确 |
| Woodyfield/Woodford |
Woodifield |
凯瑟琳·曼斯菲尔德小说《苍蝇》中的角色名 Mr. Woodifield |
| nuance of himself |
nuisance of himself |
英文习语 make a nuisance of oneself |
| 材质刀 |
裁纸刀 |
近音词,写字台上的工具 |
| plunted |
planted |
近音修正 |
| grave-looking bar |
grave-looking boy |
根据上下文照片内容修正 |
| 石锄 |
橱柜 |
中文近音及逻辑修正 |
| strict QT |
strict Q.T. |
英文习语,意为私下、秘密 |
| 浸入 |
注入 |
倒酒动作描述 |
| 雷盖 |
雷吉 |
人名 Reggie 的通译 |
| Nocturne's Ye Qu |
Nocturnes |
乐队 Nocturnes(夜曲乐队),Whisper 翻译了中文名 |
| It 7 a.m. Beijing time... (to the end) |
|
由于背景音乐导致的整块新闻幻觉/串台内容,直接删除 |
来感受下强大的sonnet4.6,每次用它生成工具和生成页面都是超出预期,最终成品:
https://fm.bitags.com
虽然转录的文本不是很好,而且whisper要求的GPU资源很低,有些音频的文本要么是被whisper弄丢了,要么是被Gemini弄丢了,远非完美,但我没有别的选择。即使这样,用来当作《More
to Read》音频节目的内容检索工具已经是绰绰有余。
从检索结果可以知道,我第一次听这个节目是2024-05-01,真是够晚的,而且也是一个五一,真是一个奇怪的轮回;还有2022-12-01开始有一周节目录音搞错了,串成了Special English;很多节目都有重播,很明显如十一。
说句题外话,上所有网站,知乎也好,B站也罢,从来都不感觉是放松——要么是为了猎奇,要么为了学习新东西,只有一个网站是例外,那就是豆瓣,逛豆瓣的时候从来不是为了学习,也不是为了娱乐,没有任何功利的目的,就是彻彻底底的放松——可笑的是,我已经多年不上豆瓣了,即使这一刻我也懒得上,眼睛已开始老花,还是省着点好——正如《More
to
Read》节目的片头:"听,鸟儿的欢鸣,溪水的婉转。听,爱与恨,悲与喜,苦与乐,得与失。听,跳跃的文字,灵动的声音。You're
listening to More to
Read"。生命苦短,就让声音来抚慰疲惫的灵魂吧。
More to Read
2026 May 04 See all posts第一次听《More to Read》这个节目,是在某天早晨。6点40多,随便打开收音机,里面传来用中英文双语播讲的《老人与海》,马上被播音员的声音和配乐深深吸引住,节目制作得可以用精美来形容,从此就喜欢上了。6点多是给孩子做早饭的时间,不可能每天准时听,于是又下载了"云听"这个App来听回放,到后来连回放也没有时间听,时间就一天天过去了,这就是成年人的真实生活吧。
到后来就是去年12月份,整台的节目都停播了,于是赶在元旦前的最后一天,把所有音频都下载下来,从2022-04-28到2025-12-22共1335篇,54.1G。云听app里下载下来的文件名是无意义的时间戳,于是想着快点把音频的文件名整理出来。结果马上就是元旦后工作变动,告别之前的GPU集群。从此与世隔绝,真是一丁点属于自己的时间都没有了。
终于在4月28号,排除万难,先从https://build.nvidia.com里申请了
whisper-large-v3的免费额度,把字幕弄出来,结果只能说是勉强可用。于是又借用翻译界最强大的Gemini模型,为了省钱,用的是gemini-3-flash-preview进行了校对,整个过程中用claude-sonnet-4-6进行工具编写和网页编写,一切都是为了省token,终于在2026-05-03完工。在手机上把玩许久,非常满意。这么简单的一件事情,搁以前一两天就干完了,居然花了4个月才办成,令人唏嘘。来感受下Gemini恐怖的翻译能力,节选自它生成的勘误表,比人聪明和渊博多了:
来感受下强大的sonnet4.6,每次用它生成工具和生成页面都是超出预期,最终成品:
https://fm.bitags.com
虽然转录的文本不是很好,而且whisper要求的GPU资源很低,有些音频的文本要么是被whisper弄丢了,要么是被Gemini弄丢了,远非完美,但我没有别的选择。即使这样,用来当作《More to Read》音频节目的内容检索工具已经是绰绰有余。
从检索结果可以知道,我第一次听这个节目是2024-05-01,真是够晚的,而且也是一个五一,真是一个奇怪的轮回;还有2022-12-01开始有一周节目录音搞错了,串成了
Special English;很多节目都有重播,很明显如十一。说句题外话,上所有网站,知乎也好,B站也罢,从来都不感觉是放松——要么是为了猎奇,要么为了学习新东西,只有一个网站是例外,那就是豆瓣,逛豆瓣的时候从来不是为了学习,也不是为了娱乐,没有任何功利的目的,就是彻彻底底的放松——可笑的是,我已经多年不上豆瓣了,即使这一刻我也懒得上,眼睛已开始老花,还是省着点好——正如《More to Read》节目的片头:"听,鸟儿的欢鸣,溪水的婉转。听,爱与恨,悲与喜,苦与乐,得与失。听,跳跃的文字,灵动的声音。You're listening to More to Read"。生命苦短,就让声音来抚慰疲惫的灵魂吧。