ai-0 lead in

Technology2,310 words12 min readAgent

0. Lead in

workflow

这一部分说是工作流,其实应该是我探索怎么高效地使用ai,要形成什么样的思维模式和习惯,时刻注意更新!

之前我是对vibe coding或者说各种各样的agent是没有任何的感觉的。24年cursor开始有起色的时候,我就用过一段时间,一直tabtabtab也没什么意思,一开始的cursor我记得主打的还是辅助编程 --- tab。随着agent概念,tool use还有mcp server等各种新奇技术不断涌现后,agent模式开始取代tab成为cursor的看板娘。我也尝鲜充值了几个月会员,虽然最后也没用什么,对agent模式的印象是相当不好的:

  1. 一股脑儿生成一堆莫名其妙的东西,而且还动不动喜欢给我写什么总结文档,修复一个bug又给我写个文档,在项目根目录下面乱丢垃圾。
  2. 废话很多,上下文一长就开始说胡话,幻觉还是挺严重的。
  3. 项目一开始,他的上下文还够的时候,倒是做得有模有样,但是一旦规模上去了,agent就开始瞎搞了,最后的结果只能是重构,或者重新开项目,再次抽卡。
  4. 我的参与感很低,很多时候完全搞不明白他到底在做什么。

其实后面的vibe coding概念越来越火倒是慢慢让我去反思做得不好的地方在哪里。

如果我要选择使用这样的模式来开发什么自己玩的小玩意儿,就不要陷入micro management的陷阱中去。作为一个leader -- 而非写代码的牛马,需要做的是指明方向,脑袋里有框架,限定范围,让llm更高效更准确的coding。

因此这整个工作流就非常重要。

fundamental rules

在开始构建之前,就应该用各种方式帮助自己想好这个project是怎么样的框架。然后想明白自己的需求是怎么样的,同时提出硬性要求的 do and donts。CLAUDE.md大概就是这样的想法,所以维护Fundamental Rules是决定构建过程愉快与否和最终成果o不ok的关键因素。

prompt!

之后就是提示词的问题,我愈发地感受到表达能力的重要性,不仅仅是对于llm的prompt。将一件事情的逻辑讲清楚讲明白,将自己的需求讲清楚讲明白,对你我他还有ai都好。仍需加油努力

指挥ai做事的时候,指明他的身份 -- 一般感觉都是说你是一个资深的软件工程师啦吧啦吧啦;讲清楚前因后果;加上自己的思考,指明一条可能的路径;需要他做的事情按照逻辑或者先后顺序一条一条结构化地列出来;最后想要达到的预期是怎么样的;有什么可以提供的材料尽量提供。以上这些都是提高我和ai生产效率的方式。

如果每天想着去完善自己的prompt,我觉得对于自己的逻辑思维还有行动力也许都会有点帮助吧。

context summary

当然仅仅有好的提示词还远远不够,现在的llm显然理解能力已经提升很多了,就算你的prompt写得巨烂无比,他大概率也能猜出你要干嘛 -- 但是这不是随便乱写prompt的接口。

很重要的问题就是上下文窗口是有限制的,现在好的coding llm大致有200多k的上下文。针对于上下文的问题,已经有很多技术推出来了,去年上半年很火的RAG,还有知识库啊之类的,这些都是值得探索的东西。 但是私以为现在的技术迭代实在太快,还有每天贩卖焦虑的各种营销号打着莫名其妙的标题,越来越让我感觉快速学习知识和了解新技术表皮之下的本质逻辑在目前的时代实在是太重要了。需要不断地push自己keep learning。

又跑偏了。上下文窗口有限制,因此这次在实践的时候,每使用一定的上下文,我总是会让agent总结归纳目前的工作,同时生成一份用于指导后继的带着满血上下文的agent工作的手册,再生成一份给我看的包含项目框架还有重要接口的手册 -- 或许可以称之为cheat sheet,让我对这个项目有着一定的掌控力,我知道发生了啥,哪个文件哪个文件是做啥的。

因此每隔一段时间去明确一下目前我们所在的位置,和接下来工作的方向,把一些已经做好的工作精炼成结构化的文档非常重要。这在claude code里称作是/compact,不知道为什么cursor没提供这个功能,还是说我不知道 -- 慢慢研究看看吧。

简化接口和模块化

如果这是一个需要长期维护的项目 -- 比如我的blog,那么将基本的配置信息 --- 比如我要用什么字体啊,每一处的字体大小是啥啊,上传新的posts或者我要更新页面的一些元素 -- 封装成非常简单的config接口是很有用的。

简化接口就可以让我们后续要自己做点改动的时候,只要修改一下config文件中的参数,看看效果就可以了,而不是去一堆看得脑袋疼的代码里面找具体的代码在哪里。

优秀的模块化不仅可以提高ai debug的准确度,还大大地提高了我看懂代码的概率。

对于软件工程和项目设计,我还是云里雾里,要将这部分的知识快速地添加到我的todo list。

后面学到更多新东西,理解更透彻了,再回来增增补补吧


Practice

本来计划1月底就把这个blog的事儿给办了,但是一拖就快拖到了2月下旬,但好在最后还是高效率地完成了,也就延后了半个月。这一部分我计划慢慢写


Experience

科学上网和寻找有用资源非常重要,这里就记录一些我碰到的非常有用的工具和网站吧,记录下来就当作是纯纯的经验了,当然以后要是经验不适用了,回不回来改就看心情了,先就这么写着吧。

科学上网

老生常谈

to be continue...

Google账号相关

给ai充钱

在此只记录我23、24年探索出来的给ai充钱的道路,目前只适用于IOS。

前置要求

  1. 首先得能科学上网
  2. 手机是苹果机
  3. 想起来再补充,好像没啥前置要求了

1. 注册一个apple美区账号

第一步

最好是注册自己的美区账号,因为后续还要往里面充dollar。

准备一个没有注册过appleID的邮箱,最好是Gmail。

科学上网最好选择美国节点。

第二步

使用完全代理或者说全局模式(最好)

打开后面的网站创建Apple ID:https://account.apple.com/account#!&page=create

appleid

界面是中文没有关系,国家或地区一定要选美国,手机号码可以选中国的,如果中国手机号码不行,只能美国或者外国的,那就只能使用sms发短信服务了 -- 即虚拟手机号发短信,几块钱就能买一个,收到验证码注册好账号即可。

具体的虚拟手机号收短信服务,google一下就可以得到了。

第三步

成功注册美国的Apple ID后,iPhone开代理模式,使用美国节点 -- 如果你已经科学上网了,那么一定有方法手机也科学上网的。

App Store登录美区id。弹出iTunes等等各种各样的要求都不用管,有关地区的选项一定要选择United States即可。

最关键的一步在于,选择付款方式,如果你有可以用的visa卡或者paypal,就试试看,不行的话挂对梯子应该是可以跳过的。

关于街道信息,姓名等,网上搜一搜即可。

美区App Strore需要交税,如果你想便宜一点,地址处填入税率较低的州即可 -- 可google 可 ai

所有都填写完成后,就注册好了。

第四步

美区app store下载chat gpt、claude等ai软件。

购买美区礼品卡充美元进你的账户,网上总是可以买到的,我用的是https://shop.pockyt.io/pc/brands/all

之后你就可以登录自己的chat gpt或者Claude账号,然后在手机上订阅会员,用礼品卡充进的美元进行消费,而不用使用visa卡 --- 反正国区的总是付不了款的。

剩下to be continue

Comments

Powered by GitHub Discussions via Giscus.