via happy xiao
happy xiao 的频道
我是 happy,你可以在 aa.ee 了解我更多
- 这篇介绍艾伦·阿尔达“三条表达法则”的文章,对任何形式的沟通都很有启发。其核心原则是: 1. 一次只讲不超过三个重点; 2. 遇到复杂概念时,尝试用三种不同方式来解释; 3. 对于关键观点,重复强调三遍。
via happy xiao -
- 聊聊语音输入转文字这件事
大概两周前受到 这篇文章 的启发,我开始在全平台尝试使用 Wispr Flow 进行语音转文字。今天分享一下这段时间的经验。
硬件
硬件分两部分来说。
首先是家里。我使用 Mac mini M2 Pro 和 Studio Display。如果不用外接话筒,默认收音设备就是 Studio Display。一个人在家时,对着显示器说话没什么问题;但家里有人的话,中等音量就会被听到内容。隐私倒不是问题,只是旁边有人时总会有所顾忌,有时候他们听到我输入的内容, 还会来笑我。
解决方案很简单:直接使用我桌面上原本用于录播的设备——舒尔 SM7 话筒和 Apogee Symphony Desktop 声卡。这样即使用很小的声音低语,也能准确识别。
另一个场景是在公司开放办公环境里使用 Windows PC。直接用笔记本麦克风显然不合适。我试过有线麦克风,但手持讲话总觉得别扭,桌上多根线也不好看。
后来想到蓝牙无线麦克风。最火的是 Wispr Flow 官方提到的大疆 Mic Mini 2,但价格要三百多块。如果最后用不习惯,成本还是有点高。
后来我买了博雅(Boya)的 Mini 2 一拖一基础款,闲鱼上 110 元包邮。用了两天,效果出乎意料地好。在公司只需很小音量低声说话,麦克风夹在衣领上,不需要手持,也没有线缆干扰。
至于 iPhone,我直接对着手机麦克风说话。
软件
AI 语音转文字软件很多,从开源免费到付费订阅都有。
我之前试过 Superwhisper、Aiko,还有别人推荐但尚未体验的 Typeless 和 Monologue。目前用了差不多一个星期的 Wispr Flow,已经能很好满足需求。
语音转文字最大的痛点,是某些词或句子无法被正确识别。Wispr Flow 的 Dictionary 功能很好地解决了这个问题。
发现识别错误后,直接修改文字即可。Wispr Flow 会记住正确写法并自动加入 Dictionary,下次便能正确识别。当然也可以手动添加词条。
除此之外,这类 App 通常还有一些 AI 辅助功能,比如整理成 AI 提示词,或者转换成商务邮件格式。不过这些功能我用得不多。
至于 Wispr Flow 和苹果自带语音转文字的差距,我只能说是天壤之别。用过 Wispr Flow 之后,再回去用苹果自带方案,几乎无法忍受。
好处
首先当然是更快。
这篇文章就是我用语音输入完成的。如果全靠手敲,大概至少需要三倍时间。
第二个好处是记录成本大幅降低。当输入变得足够轻松时,我会记录更多细节。无论是写日记还是记录工作日志,都能写得更详细。
以前打字时,为了减少输入量,我总会尽量简洁,不可避免地遗漏很多细节。
第三个好处是 AI 会顺手帮忙整理格式。比如口述清单时自动分行、添加编号;口述标点时自动补全;有时甚至还能正确加上括号。
最后分享一下我的 Wispr Flow 邀请码。如果你通过 这个链接 注册,可以免费使用一个月(我也能额外获得一个月 Pro 权限)。
via 火米博客 (author: happy) - 早上在罗森买了一个巧克力味儿的吐司面包,价格是6.5元。突然想起来,差不多20年前,每天早上也是喜欢在公司楼下的罗森买一个面包当早餐。那个时候罗森面包的价格就已经是六块钱、七块钱、八块钱这个样子。感觉20年都没有涨,怎么做到的?
via happy xiao - 我个人一直赞同威廉·詹姆斯(William James)的观点。他曾说: “没有什么人比这样的人更可悲:他除了犹豫不决之外,没有任何事情成为习惯。对他而言,每点燃一支雪茄、每喝一杯饮料、每天何时起床和睡觉,以及开始任何一项工作,都要经过刻意的意志抉择和反复权衡。”
via happy xiao -
- 平平无奇的伟大
肥醲辛甘非真味,真味只是淡;神奇卓异非至人,至人只是常。 - 菜根谭
伟大的,往往看起来稀疏平常,我想用身边的三个故事,讲讲我的看法。
虚张声势
JR 迷上了嘻哈音乐。前阵子,和我说了一件饶舌歌手 Drake 的新闻。为了给新专辑造势,Drake 在多伦多街头放置了一个巨大的冰雕,把专辑发布日期放在冰雕内部,等它慢慢融化,让人挖出来。据说这个类似快闪的行为艺术,在线上线下都造成了轰动效应,引来了消防部门的关注,最后驱逐了人群,对冰雕进行了清理。听到这里,我和 JR 说,也许这能说明,Drake 有点江郎才尽,对新专辑没有太多信心了。
过了几天,JR 又和我提到这张新专辑。他告诉我,尽管 Drake 一口气发布了18首歌(远超一张嘻哈专辑的歌曲数量),但似乎每一首听起来都差不多,没有让人眼前一亮的曲子。我心想,看来之前的预感是对的,如果专辑足够好,根本没必要去制造噱头。哪怕低调发布,歌迷和乐评人也会因为音乐足够好,口耳相传,最终让专辑大卖。
而哪些呱噪的,虚张声势的,往往是在掩饰某种不足。
专业的落语
每周,我都期待一部日本动画的更新。它叫做《朱茵落语》,讲的是一个年轻落语表演者,逐渐成长的故事。(落语是日本的评书)
在上周播放的一集里,故事主角朱音,以高中生的身份,参加了一场大学生之间的落语表演赛。小姑娘本来想大展身手,一句夺得冠军,以此获得与业界泰斗对话的资格。没想到,自己的师傅要求必须以《万寿无疆》这个段子报名参赛。要知道,这个段子虽然经典,但人人皆知,反而没有了亮点。靠着一个传统段子,想通过仅有的一两次表演机会,夺得头筹,绝对是难上加难。
Read more
via 可乐周报 (author: happy xiao) -
-
-
-
- Surge 的 Snell 协议要升级 v6 版了,我的理解是性能不变,伪装方式升级为每个小鸡拥有独特的指纹,反检测性能提升。 文档 👉 https://nssurge.com/blog/snell-v6/
via happy xiao -
-
- 今天学到了:日本人看到可爱的狗狗会说“wanchan”,看到可爱的猫咪会说“nyanchan”。
(这段是用语音输入的,竟然“wanchan”和“nyanchan”都能自动识别,也是有一点厉害。)
via happy xiao -
-
- 接下来的问题就是,在公司要使用什么设备来实现同样的效果。在桌面上摆一个麦克风还是太突兀了一些;用有线的、很小的那种感觉也挺麻烦,一条线放在桌上也不美观。考虑买一个大疆的 Mic Mini2。
via happy xiao -
- 一个安全的玩耍空间
Austin Kleon 在他的新书 Don’t Call It Art 中提到了创造的三要素:时间,空间,和材料。
关于空间,他写道:艺术家需要空间。不一定非得是一整间房,但总得有属于自己的空间。艺术家的空间既可以在家里创造,也可以在家外寻找。大多数艺术家都梦想拥有一个与居住空间分开的地方——比如大楼里的工作室、一间小棚屋,甚至一个车库。能拥有地下室、阁楼,或一间属于自己的卧室,都已经算幸运了。有时候,艺术家不得不满足于角落里的一张书桌,或者餐桌上的一席之地。
很可惜,我还没法拥有一个属于自己的空间。
……
如果你的工作具有可移动性,或者你能够让它变得具有可移动性,那么有时你可以到现实世界中寻找一些发挥和放松的空间——也就是雷·奥尔登堡(Ray Oldenburg)所说的“第三空间”(third places),例如公园、图书馆或咖啡馆。(“第一空间”是家,“第二空间”是工作场所。)如今,许多这样的第三空间正在从现代生活中逐渐消失,但你或许仍能在一些意想不到的地方找到它们。
幸运的是,我的创意工作具有可移动性,所以,只要我带者电脑,和一副隔音耳塞,就能在图书馆,或者公园里工作。
话虽如此,我还是梦想能有一个 Austin 这样的工作室,一个属于我的,可以安全玩耍的空间。
via 火米博客 (author: happy)