Skip to main content

happy xiao 的频道

我是 happy,你可以在 aa.ee 了解我更多
  1. 这篇介绍艾伦·阿尔达“三条表达法则”的文章,对任何形式的沟通都很有启发。其核心原则是: 1. 一次只讲不超过三个重点; 2. 遇到复杂概念时,尝试用三种不同方式来解释; 3. 对于关键观点,重复强调三遍。

    via happy xiao
  2. 聊聊语音输入转文字这件事

    大概两周前受到 这篇文章 的启发,我开始在全平台尝试使用 Wispr Flow 进行语音转文字。今天分享一下这段时间的经验。

    硬件

    硬件分两部分来说。

    首先是家里。我使用 Mac mini M2 Pro 和 Studio Display。如果不用外接话筒,默认收音设备就是 Studio Display。一个人在家时,对着显示器说话没什么问题;但家里有人的话,中等音量就会被听到内容。隐私倒不是问题,只是旁边有人时总会有所顾忌,有时候他们听到我输入的内容, 还会来笑我

    解决方案很简单:直接使用我桌面上原本用于录播的设备——舒尔 SM7 话筒和 Apogee Symphony Desktop 声卡。这样即使用很小的声音低语,也能准确识别。

    另一个场景是在公司开放办公环境里使用 Windows PC。直接用笔记本麦克风显然不合适。我试过有线麦克风,但手持讲话总觉得别扭,桌上多根线也不好看。

    后来想到蓝牙无线麦克风。最火的是 Wispr Flow 官方提到的大疆 Mic Mini 2,但价格要三百多块。如果最后用不习惯,成本还是有点高。

    后来我买了博雅(Boya)的 Mini 2 一拖一基础款,闲鱼上 110 元包邮。用了两天,效果出乎意料地好。在公司只需很小音量低声说话,麦克风夹在衣领上,不需要手持,也没有线缆干扰。

    至于 iPhone,我直接对着手机麦克风说话。

    软件

    AI 语音转文字软件很多,从开源免费到付费订阅都有。

    我之前试过 Superwhisper、Aiko,还有别人推荐但尚未体验的 Typeless 和 Monologue。目前用了差不多一个星期的 Wispr Flow,已经能很好满足需求。

    语音转文字最大的痛点,是某些词或句子无法被正确识别。Wispr Flow 的 Dictionary 功能很好地解决了这个问题。

    发现识别错误后,直接修改文字即可。Wispr Flow 会记住正确写法并自动加入 Dictionary,下次便能正确识别。当然也可以手动添加词条。

    除此之外,这类 App 通常还有一些 AI 辅助功能,比如整理成 AI 提示词,或者转换成商务邮件格式。不过这些功能我用得不多。

    至于 Wispr Flow 和苹果自带语音转文字的差距,我只能说是天壤之别。用过 Wispr Flow 之后,再回去用苹果自带方案,几乎无法忍受。

    好处

    首先当然是更快。

    这篇文章就是我用语音输入完成的。如果全靠手敲,大概至少需要三倍时间。

    第二个好处是记录成本大幅降低。当输入变得足够轻松时,我会记录更多细节。无论是写日记还是记录工作日志,都能写得更详细。

    以前打字时,为了减少输入量,我总会尽量简洁,不可避免地遗漏很多细节。

    第三个好处是 AI 会顺手帮忙整理格式。比如口述清单时自动分行、添加编号;口述标点时自动补全;有时甚至还能正确加上括号。

    最后分享一下我的 Wispr Flow 邀请码。如果你通过 这个链接 注册,可以免费使用一个月(我也能额外获得一个月 Pro 权限)。

    via 火米博客 (author: happy)
  3. 早上在罗森买了一个巧克力味儿的吐司面包,价格是6.5元。突然想起来,差不多20年前,每天早上也是喜欢在公司楼下的罗森买一个面包当早餐。那个时候罗森面包的价格就已经是六块钱、七块钱、八块钱这个样子。感觉20年都没有涨,怎么做到的?

    via happy xiao
  4. 我个人一直赞同威廉·詹姆斯(William James)的观点。他曾说: “没有什么人比这样的人更可悲:他除了犹豫不决之外,没有任何事情成为习惯。对他而言,每点燃一支雪茄、每喝一杯饮料、每天何时起床和睡觉,以及开始任何一项工作,都要经过刻意的意志抉择和反复权衡。”

    via happy xiao
  5. 平平无奇的伟大

    肥醲辛甘非真味,真味只是淡;神奇卓异非至人,至人只是常。 - 菜根谭
    伟大的,往往看起来稀疏平常,我想用身边的三个故事,讲讲我的看法。

    虚张声势

    JR 迷上了嘻哈音乐。前阵子,和我说了一件饶舌歌手 Drake 的新闻。为了给新专辑造势,Drake 在多伦多街头放置了一个巨大的冰雕,把专辑发布日期放在冰雕内部,等它慢慢融化,让人挖出来。据说这个类似快闪的行为艺术,在线上线下都造成了轰动效应,引来了消防部门的关注,最后驱逐了人群,对冰雕进行了清理。听到这里,我和 JR 说,也许这能说明,Drake 有点江郎才尽,对新专辑没有太多信心了。

    过了几天,JR 又和我提到这张新专辑。他告诉我,尽管 Drake 一口气发布了18首歌(远超一张嘻哈专辑的歌曲数量),但似乎每一首听起来都差不多,没有让人眼前一亮的曲子。我心想,看来之前的预感是对的,如果专辑足够好,根本没必要去制造噱头。哪怕低调发布,歌迷和乐评人也会因为音乐足够好,口耳相传,最终让专辑大卖。

    而哪些呱噪的,虚张声势的,往往是在掩饰某种不足。

    专业的落语

    每周,我都期待一部日本动画的更新。它叫做《朱茵落语》,讲的是一个年轻落语表演者,逐渐成长的故事。(落语是日本的评书)

    在上周播放的一集里,故事主角朱音,以高中生的身份,参加了一场大学生之间的落语表演赛。小姑娘本来想大展身手,一句夺得冠军,以此获得与业界泰斗对话的资格。没想到,自己的师傅要求必须以《万寿无疆》这个段子报名参赛。要知道,这个段子虽然经典,但人人皆知,反而没有了亮点。靠着一个传统段子,想通过仅有的一两次表演机会,夺得头筹,绝对是难上加难。

    Read more

    via 可乐周报 (author: happy xiao)
  6. 试了一下 Boya mini2 蓝牙麦克风。低语模式,语音转文字效果实现得非常好。如果在办公室的话,可以开启 AI 降噪模式,估计也能准确收音。

    via happy xiao
  7. Market Wizards 系列的新书,赶紧入手。 听过两本这个系列,包括十几个传奇交易员的经历,他们的共同点就是,完全没有共同点。

    via happy xiao
  8. 我刚刚用 Wispr Flow 在论坛用语音发帖,说,“兄弟们”,被家里人听到嘲笑了。

    via happy xiao
  9. 又充了一千三土耳其里拉,看看这汇率走势真的是,土区性价比越来越高。

    via happy xiao
  10. 今天学到了:日本人看到可爱的狗狗会说“wanchan”,看到可爱的猫咪会说“nyanchan”。
    (这段是用语音输入的,竟然“wanchan”和“nyanchan”都能自动识别,也是有一点厉害。)

    via happy xiao
  11. 接下来的问题就是,在公司要使用什么设备来实现同样的效果。在桌面上摆一个麦克风还是太突兀了一些;用有线的、很小的那种感觉也挺麻烦,一条线放在桌上也不美观。考虑买一个大疆的 Mic Mini2。

    via happy xiao
  12. 直接用我桌面上的舒尔SM7当做Wispr Flow的输入麦克风。现在用非常小的音量来使用语音转文字。试了好半天了,正确率非常高! 可以说百分之九十九的情况下都能正确输入。

    via happy xiao
  13. 一个安全的玩耍空间

    Austin Kleon 在他的新书 Don’t Call It Art 中提到了创造的三要素:时间,空间,和材料。

    关于空间,他写道:
    艺术家需要空间。不一定非得是一整间房,但总得有属于自己的空间。艺术家的空间既可以在家里创造,也可以在家外寻找。大多数艺术家都梦想拥有一个与居住空间分开的地方——比如大楼里的工作室、一间小棚屋,甚至一个车库。能拥有地下室、阁楼,或一间属于自己的卧室,都已经算幸运了。有时候,艺术家不得不满足于角落里的一张书桌,或者餐桌上的一席之地。
    ……
    如果你的工作具有可移动性,或者你能够让它变得具有可移动性,那么有时你可以到现实世界中寻找一些发挥和放松的空间——也就是雷·奥尔登堡(Ray Oldenburg)所说的“第三空间”(third places),例如公园、图书馆或咖啡馆。(“第一空间”是家,“第二空间”是工作场所。)如今,许多这样的第三空间正在从现代生活中逐渐消失,但你或许仍能在一些意想不到的地方找到它们。
    很可惜,我还没法拥有一个属于自己的空间。

    幸运的是,我的创意工作具有可移动性,所以,只要我带者电脑,和一副隔音耳塞,就能在图书馆,或者公园里工作。

    话虽如此,我还是梦想能有一个 Austin 这样的工作室,一个属于我的,可以安全玩耍的空间。

    via 火米博客 (author: happy)