2025 年 暑假小结
开发
独立开发
这个暑假主要的收获还是发布了我的第一个付费软件“狸语字幕助手”。算是打通了从需求发掘、功能设计、开发实现、上架收款,最后宣传推广的一个闭环了。
这个软件算是我在独立开发上的第一次尝试,选择发布在微软应用商店主要有以下几点考量:
- 付费直接走商店,省去自己接收款渠道的麻烦
- 商店自带展示页,不做 landing page 也有一定的 SEO 作用
- 微软应用商店为 Windows 自带,类似于苹果设备上自带的应用商店,作为软件分发渠道,用户接受度高
特别是,很多国内社交媒体会屏蔽 UGC 内容中的链接,限流、链接无法点击都是常规操作。
直接通过应用商店分发有时可以省去在推广内容中带链接的麻烦。
(也因此,小红书上一大票的独立开发者都只做 iOS。)
但是这个项目由于现有的开源 ASR 方案的一些局限性,效果只能说勉强。比如说,在说话的同时进行打字或者鼠标点击,对于声音比较大的键鼠(或者对于喜欢用力打字的用户),打字声和鼠标声很容易影响模型的识别导致误判。以及对于 SenseVoiceSmall 模型,在中英混杂的场景下还是比较吃力。
本来想过把这个项目的语音识别部分抽离出来,再做成语音输入法、桌面语音字幕之类的软件,但经过调研,发现相关的软件已经很卷了,甚至操作系统自带的相关软件也能凑合一用,感觉也没有做的必要了。
开源项目
- 为了优化“狸语”中 SenseVoice 模型的使用,二开了 SenseVoice.cpp 这个项目,给加上了 REPL 功能并提了 PR。
- 发布了一个利用 PyStand 来自动化打包 Python 项目的一个 GitHub Action:pystand-build。(这也是我第一次发布 GitHub Action)
- 把之前在 InputShare 中使用的 scrcpy 客户端相关的类型定义和工具函数抽离成单独的 Python 包,方便后续 InputShare-next 的开发。
我的七月主要花在了“狸语字幕助手”这个项目上,八月下半和九月初则主要花在了 LLM Hooks 这个项目上。
LLM Hooks 这个项目旨在让大语言模型的重度使用者能够深度自定义自己的大模型 API 调用。它提供了灵活插件机制,使用者可以通过导入插件的方式,在大模型调用的全过程(请求前,流式传输中、响应后)进行自定义。
我同样提供了一些示例插件,方便使用者直接使用或者自行开发插件。
这个项目带给我的收获如下:
- 补齐了我后端经验不足(尤其是数据库操作相关)的空缺
- 对于带有插件系统的软件的设计有了一定的经验
- 尝试了下使用 AI 来 Vibe Coding 前端部分
输出
这两个月写的博客文章不多,主要集中在“今日趣闻”下,算是有时有感而发水一下。
不过这两个月里写日志倒是很勤快,每天一篇,没有缺卡的。
这两个月里主要的输出方式由博客转移为直播。
- 一方面是想通过直播来测试一下自己的软件
- 另一方面也是因为放假了比较无聊,开直播也有人能聊聊天
,顺便还能带带货
求职面试
这两个月面试面了不少次数,offer 是一个没拿到。不过我也不是很迫切地需要找到工作,所以就先随缘吧。
尝试投了一些大厂,发现清一色地都要笔试,然后就放弃了。