开发了一个小程序辅助分析食品是不是健康

中秋节前两天突然有一个想法:做一个应用识别食物的配料表信息,然后分析这个食物是不是健康。因为最近经常看到各种新闻说那个食物里面有哪些添加剂,不健康,或者某些成分对人体不好之类的,那天晚上睡不着,突然脑子里就有这个想法了。

这是小程序码,感兴趣的小伙伴可以试一下
配料放大镜

开发过程

由于我自己不会小程序的开发,有这个想法后,第一时间找了一个会小程序开发的同事聊一下,他觉得可以做,就帮忙做了第一个版本的UI,我后来借助大模型在他的基础上稍微修改了一点点。

现在也勉强算入门小程序开发了。

不得不感叹,有了大模型之后,学习一个新的框架比以前容易太多了,和大模型结对编程,说清楚需求后,请它给出方案,然后一步一步写代码,自己再调整一下,不理解的地方就问它,它会解释的非常清楚。基本上一个具体的项目做下来,就能大体掌握一个新的框架了,而且要比以前自己查资料快很多。

后端是自己做的,依然是基于Django+DRF,用熟了之后,发现这一套框架对于并发没有那么高的场景来说,表现非常出色。

踩过的一点坑

这个小程序的主体功能,也就是分析配料成分的部分,其实是调用的大模型,所以技术难度不是很大,让用户拍个照片,然后对图片内容进行分析,给一些合适的prompt就行了。

在工作中,我一直使用的是GPT-4o和GPT-4o-mini,这次因为这个小程序,第一次使用国产的多模态大模型,发现差距还是挺大的,图片识别效果上差很多,而且API的响应速度也差不少。

最大区别是,国产多模态大模型,似乎不支持system prompt,基本上不起任何作用,搞得我一度以为国产多模态居然这么差劲,但是后来想想它们的app对于图片识别的效果挺好的,不应该API的效果这么差,就试着直接在user prompt添加一些要求,发现效果好很多,这一点区别坑了我很久,搞了大半天。

另外,我一开始是让用户把图片传到服务器上,然后在服务器上进行大模型识别操作的,但是这个过程非常消耗服务器带宽,我的服务器配置较低,这么做的话10 rps 就已经非常慢了,后来修改了一下逻辑,调用大模型的过程放在客户端,这样不经降低了对服务器性能的消耗,可以让服务器支撑更高的并发,而且整个识别过程耗时也降低了不少,毕竟减少了传输照片的时间。

独立开发者

最近看到很多关于独立开发者的信息,这次自己实实在在做了一个小产品,发现想做一个独立开发者,还能养活自己和家人是不容易的,其难度甚至比在公司挣工资还要难。
首先你要有一个好的idea,能解决一部分的需求,
然后你要开发能力,虽然可以不要求技术栈,也有大模型的辅助,但是这依然不容易,尤其独立开发者基本上都应该是全栈开发,这就更不容易了,
最后,有了产品,还要进行推广,这一步估计绝大部分程序员都没有思路,因为这基本上跟程序员的日常工作不相关。

一点想法

老实讲,没有打算通过这个小程序赚到多少钱,但是这个过程也的确让我学到了很多,知道了自己依然有很多不足,以后在工作中可以有侧重的补足一下。