Skip to main content

happy xiao 的频道

我是 happy,你可以在 aa.ee 了解我更多
  1. 昨天在闲鱼上买了两支 Ohto 的水笔,刚刚又在翻卖家的库存,已卖出的宝贝里,看到两本很熟悉的 Midori 的台历,忽然想起来,这不就是我半年前买下的。

    via happy xiao
  2. 这篇介绍艾伦·阿尔达“三条表达法则”的文章,对任何形式的沟通都很有启发。其核心原则是: 1. 一次只讲不超过三个重点; 2. 遇到复杂概念时,尝试用三种不同方式来解释; 3. 对于关键观点,重复强调三遍。

    via happy xiao
  3. 聊聊语音输入转文字这件事

    大概两周前受到 这篇文章 的启发,我开始在全平台尝试使用 Wispr Flow 进行语音转文字。今天分享一下这段时间的经验。

    硬件

    硬件分两部分来说。

    首先是家里。我使用 Mac mini M2 Pro 和 Studio Display。如果不用外接话筒,默认收音设备就是 Studio Display。一个人在家时,对着显示器说话没什么问题;但家里有人的话,中等音量就会被听到内容。隐私倒不是问题,只是旁边有人时总会有所顾忌,有时候他们听到我输入的内容, 还会来笑我

    解决方案很简单:直接使用我桌面上原本用于录播的设备——舒尔 SM7 话筒和 Apogee Symphony Desktop 声卡。这样即使用很小的声音低语,也能准确识别。

    另一个场景是在公司开放办公环境里使用 Windows PC。直接用笔记本麦克风显然不合适。我试过有线麦克风,但手持讲话总觉得别扭,桌上多根线也不好看。

    后来想到蓝牙无线麦克风。最火的是 Wispr Flow 官方提到的大疆 Mic Mini 2,但价格要三百多块。如果最后用不习惯,成本还是有点高。

    后来我买了博雅(Boya)的 Mini 2 一拖一基础款,闲鱼上 110 元包邮。用了两天,效果出乎意料地好。在公司只需很小音量低声说话,麦克风夹在衣领上,不需要手持,也没有线缆干扰。

    至于 iPhone,我直接对着手机麦克风说话。

    软件

    AI 语音转文字软件很多,从开源免费到付费订阅都有。

    我之前试过 Superwhisper、Aiko,还有别人推荐但尚未体验的 Typeless 和 Monologue。目前用了差不多一个星期的 Wispr Flow,已经能很好满足需求。

    语音转文字最大的痛点,是某些词或句子无法被正确识别。Wispr Flow 的 Dictionary 功能很好地解决了这个问题。

    发现识别错误后,直接修改文字即可。Wispr Flow 会记住正确写法并自动加入 Dictionary,下次便能正确识别。当然也可以手动添加词条。

    除此之外,这类 App 通常还有一些 AI 辅助功能,比如整理成 AI 提示词,或者转换成商务邮件格式。不过这些功能我用得不多。

    至于 Wispr Flow 和苹果自带语音转文字的差距,我只能说是天壤之别。用过 Wispr Flow 之后,再回去用苹果自带方案,几乎无法忍受。

    好处

    首先当然是更快。

    这篇文章就是我用语音输入完成的。如果全靠手敲,大概至少需要三倍时间。

    第二个好处是记录成本大幅降低。当输入变得足够轻松时,我会记录更多细节。无论是写日记还是记录工作日志,都能写得更详细。

    以前打字时,为了减少输入量,我总会尽量简洁,不可避免地遗漏很多细节。

    第三个好处是 AI 会顺手帮忙整理格式。比如口述清单时自动分行、添加编号;口述标点时自动补全;有时甚至还能正确加上括号。

    最后分享一下我的 Wispr Flow 邀请码。如果你通过 这个链接 注册,可以免费使用一个月(我也能额外获得一个月 Pro 权限)。

    via 火米博客 (author: happy)
  4. 早上在罗森买了一个巧克力味儿的吐司面包,价格是6.5元。突然想起来,差不多20年前,每天早上也是喜欢在公司楼下的罗森买一个面包当早餐。那个时候罗森面包的价格就已经是六块钱、七块钱、八块钱这个样子。感觉20年都没有涨,怎么做到的?

    via happy xiao
  5. 我个人一直赞同威廉·詹姆斯(William James)的观点。他曾说: “没有什么人比这样的人更可悲:他除了犹豫不决之外,没有任何事情成为习惯。对他而言,每点燃一支雪茄、每喝一杯饮料、每天何时起床和睡觉,以及开始任何一项工作,都要经过刻意的意志抉择和反复权衡。”

    via happy xiao
  6. 平平无奇的伟大

    肥醲辛甘非真味,真味只是淡;神奇卓异非至人,至人只是常。 - 菜根谭
    伟大的,往往看起来稀疏平常,我想用身边的三个故事,讲讲我的看法。

    虚张声势

    JR 迷上了嘻哈音乐。前阵子,和我说了一件饶舌歌手 Drake 的新闻。为了给新专辑造势,Drake 在多伦多街头放置了一个巨大的冰雕,把专辑发布日期放在冰雕内部,等它慢慢融化,让人挖出来。据说这个类似快闪的行为艺术,在线上线下都造成了轰动效应,引来了消防部门的关注,最后驱逐了人群,对冰雕进行了清理。听到这里,我和 JR 说,也许这能说明,Drake 有点江郎才尽,对新专辑没有太多信心了。

    过了几天,JR 又和我提到这张新专辑。他告诉我,尽管 Drake 一口气发布了18首歌(远超一张嘻哈专辑的歌曲数量),但似乎每一首听起来都差不多,没有让人眼前一亮的曲子。我心想,看来之前的预感是对的,如果专辑足够好,根本没必要去制造噱头。哪怕低调发布,歌迷和乐评人也会因为音乐足够好,口耳相传,最终让专辑大卖。

    而哪些呱噪的,虚张声势的,往往是在掩饰某种不足。

    专业的落语

    每周,我都期待一部日本动画的更新。它叫做《朱茵落语》,讲的是一个年轻落语表演者,逐渐成长的故事。(落语是日本的评书)

    在上周播放的一集里,故事主角朱音,以高中生的身份,参加了一场大学生之间的落语表演赛。小姑娘本来想大展身手,一句夺得冠军,以此获得与业界泰斗对话的资格。没想到,自己的师傅要求必须以《万寿无疆》这个段子报名参赛。要知道,这个段子虽然经典,但人人皆知,反而没有了亮点。靠着一个传统段子,想通过仅有的一两次表演机会,夺得头筹,绝对是难上加难。

    Read more

    via 可乐周报 (author: happy xiao)
  7. 试了一下 Boya mini2 蓝牙麦克风。低语模式,语音转文字效果实现得非常好。如果在办公室的话,可以开启 AI 降噪模式,估计也能准确收音。

    via happy xiao
  8. Market Wizards 系列的新书,赶紧入手。 听过两本这个系列,包括十几个传奇交易员的经历,他们的共同点就是,完全没有共同点。

    via happy xiao
  9. 我刚刚用 Wispr Flow 在论坛用语音发帖,说,“兄弟们”,被家里人听到嘲笑了。

    via happy xiao
  10. 又充了一千三土耳其里拉,看看这汇率走势真的是,土区性价比越来越高。

    via happy xiao
  11. 今天学到了:日本人看到可爱的狗狗会说“wanchan”,看到可爱的猫咪会说“nyanchan”。
    (这段是用语音输入的,竟然“wanchan”和“nyanchan”都能自动识别,也是有一点厉害。)

    via happy xiao
  12. 接下来的问题就是,在公司要使用什么设备来实现同样的效果。在桌面上摆一个麦克风还是太突兀了一些;用有线的、很小的那种感觉也挺麻烦,一条线放在桌上也不美观。考虑买一个大疆的 Mic Mini2。

    via happy xiao
  13. 直接用我桌面上的舒尔SM7当做Wispr Flow的输入麦克风。现在用非常小的音量来使用语音转文字。试了好半天了,正确率非常高! 可以说百分之九十九的情况下都能正确输入。

    via happy xiao