DailyRecord-March
3.20
入职的第一天,接到的任务是:把闻达的demo在服务器上用docker给搭建出来。于是我在服务器上先创建了一个miniconda3的docker,然后使用conda安装了一些依赖、git项目等;其间遇到一个问题:docker+conda后,尽管bash上显示是root,但是好像是一个虚拟的root,没有sudo等的执行文件,需要重新安装一下。此外,公司的网有点差,清华源1Mb、不用清华源只有几十kb。因而进展较慢
部署步骤进行到了模型下载这一步,但是因为网不好所以连不上hugging face,需要搭梯子。下班了,明天再搞!
- 明日任务:搞定梯子,下载好生成模型和embedding模型,最终完成demo,并调整远程访问展示
3.21
今天签合同了。
搭梯子问题卡了好久😡。这国企是一天也不能待了,网差的要死。最后还是前辈哥帮忙解决的。
但是terminal的命令,下载的那些怎么都那么几把慢啊!网速是压力之源!
更悲剧的是:今日闻达demo部署至最后一步无法运行…………..
可能是docker的问题,因而将其删除从头开始搭建。如果明天仍然不行,则尝试不用docker直接在服务器上部署
他妈的!狗日的北京通勤太痛苦了!
- 明日任务:wenda的demo。哎我真佛了这个b服务器 + docker好难用,不能直接在服务器安装conda吗,conda创建虚拟环境不也挺方便的
3.22
创建了一个git的container,但是在安装lfs的时候出了问题,需要用sudo等一些命令,但是apt下载很慢,似乎需要在docker file文件中就更换镜像源
了解了docker中与宿主机相互cp文件、docker在创建时需要用GPU对容器可见的命令;
- docker run -it –net=host –gpus all –name 容器名 -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all 镜像名
闻达demo终于无报错安装起来了
但是运行的时候,模型似乎卡住/死循环?不返回计算结果。
他妈的!压力一天比一天大!EMO了要!
今天美好的事情:
与SL、ZYR一起在附近那啥招待所吃川菜。味道不错,就是环境有点热、菜有点辣。此外,和ZYR一起自行车骑行,他一路讲解,聊的很开心!到北京以来为数不多的快乐时间。
SL骑着他那破电瓶车,本来跟我们一起的,半路给交警罚款了,就让他回去了,唉,我好难过
- 下周任务:调整闻达demo
3.23-3.24 周末!
早上乘坐地铁到清河,和NJ汇合,一起去清河
做了半小时火车到怀来辣!比北京通勤还快。下了火车有一种终于逃离压力之源的舒畅感。
中文在饭店吃了什么洋葱和羊肉炒的东西,味道不错;然后还吃了莜面、炒扁豆角;喝了营养快线味的酸奶、杏仁露。杏仁露味道不错,加热和不加热是两个味道
吃完饭和NJ一起顺路去菜市场买了点粑粑柑(最后一口没吃带回北京了)。然后不行一阵子去了宾馆,双人间一晚90,条件还挺不错….要哭了
睡了午觉,然后出去找网吧打了几把大乱斗;下了新赛季的第一把云顶,玩不明白好痛苦,老六老七出局。然后出去转了转,看了一下县城的风土人情,买了西安特产甑糕,味道也不错。天气不好,阴沉天空使我不太开心。
相对于老家,这里明显更荒凉一些,没有人、没有年轻人。
晚上吃了砂锅。酸菜白肉和竹笋炖腊肉的砂锅;点了傀儡(土豆和面的混合物作为主食?),咸咸的,有葱花。点了冰糖芦荟,和椰果罐头一个味儿。吃完又转了转。回到宾馆玩了把金铲铲,然后下去买了10斤的半个西瓜和勺子。吃了一点,大头给NJ吃了(真能吃啊这B)
睡了一晚,第二天早上吃了豆面还是什么东西,然后走路去买了个吊炉烧饼分着尝尝;NJ点了驴肉和驴肠火烧的外卖,带回北京吃了
和NJ回北京了,BYD带我在海淀区骑了好久的自行车,最后在一家新疆馆子吃了抓饭和羊肉什么馍,喝了北京的汽水(和芬达一个味),吃的挺好。就是这b人带我转来转去最后吃这种快餐属实没绷住
3.25
闻达demo部署完毕辣!
接下来需要:尝试更换通义7B/14B的模型;查看闻达前端技术栈,与前端做交接让其修改;部署另一个/几个项目(似乎要加班,tmd!)
已经将底模更新为7B,但是14B可能需要双卡,还不了解他这个框架怎么放到双卡上;
前端框架不太清楚,但是有一个二次开发的前端框架正在尝试,但是服务器网不好,nodejs安装困难。
下午看了B站上的一个从零开始大模型,感觉有点收获。还有一部分没看完
- 明日任务:或许需要看一下另一个agent代理的部署;看langchain和LLM的相关教程视频;RAG目前似乎有一套实践模板,基于faiss检索?
3.26
早上看langchain的视频教程
下午部署了wenda的二次开发webui,其中有报错;能保证基本的对话,但是文档对话功能用不了
下午抽空去面了腾讯的NLP应用研究实习生,他们是做腾讯视频剧本理解与智能助手的,感觉挺有意思。花了114定了钟点房,可惜面试的时候网不好、代码题(手写交叉熵、双指针/滑动数组解决list中满足和为n的最小连续长度)也没敲出来,BERT的损失函数、交叉熵也没回答好。
和SH交流了一下面试的经历,他目前的实习产品经理似乎工资低但是很轻松。他说TX面试结果很快会出,就可以再投了,但是我到第二天也没看到结果
部署了langchain-chatchat,可以基本运行,但存在一些问题,如知识库检索似乎没有工作、模型更换没有前端,需要在后端尝试修改回家,地铁上和ZJX吐槽工作的事情,交流中得到片刻的安慰;到家后,和NJ电话聊了聊,大诉苦水,得到了一些开导和建议,好兄弟!;夜里躺在床上,和LF聊了聊他的离职和走全奖去美国读PHD躺平5年。唏嘘之余,有点羡慕
似乎,上班的人状况都不是很好:ZYR精神衰弱吃药、LF压力大怼领导辞职、SX天天emo不想动,我自己的精神状态也不是很好,唉。唉!
- 明日任务:调整部署项目,学习
3.27
早上给领导演示了一下两个demo,边上的前辈哥部署的DB-GPT也看了;这个效果挺好,但是也有要调整的地方。如服务器上部署模型的API调用等
今天看阿里Qwen的vllm教程视频,大有收获
铸币吧,LLM聊天一个字一个字显示的效果原来是清屏+ 打印啊!前端或许就是<div>内部的反复刷新?
- 明日任务:调整部署项目,学习
晚上,和妈妈聊了聊天,倾诉了一下。得知妹妹的奶奶肿瘤晚期,突然有一种恐惧和悲伤笼罩心头。帮妈妈网上填写了检查需要的材料,相关材料也进行了保存。与SH、LMD一起打了大乱斗,片刻的开心,但是过程中没有完全放松。
3.28
继续学习qwen+vllm的宝藏up主。对asyncio的内容有些不理解。这个up主好像是c++、java高手,学习大模型相关内容上手也很快,我感到很挫败。
小米面试,问Qquant还是啥的量化不了解,adapter不了解,代码题一是n个全排列中k个逆序对数量,完全不会;一个是写梯度下降求算术平方根,初始化值、lr和反向传播这些都写的不太好
下午,视频看的差不多了,准备看一下Dify是个什么东西
晚上,打SH、NJ打游戏,和妈妈视频,开森
和沈晓宇老师的师姐聊了聊城市、职业规划、未来发展,感觉认知更清晰了
- 明日任务:学习
悲苦萦绕心头,不能散去。可能真的是房子住的还是有点远,每天通勤1.5小时。或许我需要换租了。
3.28
上午看了一会儿视频,然后捣鼓4090那台机子的docker和conda,没捣鼓出东西来。
下午问了前辈,了解怎么搞了,稍微搞了一点
下午,搞了会langchain-chatchat,发现推理慢的原因可能是gpu被占了;没找到如何更换模型为qwen
- 下周任务:qwenllm/qwen的docker image本地下载好并上传到远程服务器上,运行查看效果
又 放 假 辣 !
3.30-3.31 周末!
周六早上,和SH打了LOL,中午出去吃了吉野家;下午躺了一会儿,然后晚上和NJ去逛了古玩市场,感觉有点同质化。
之后吃了白糖汁儿的杏仁豆腐,然后吃了永和大王的快餐,赶紧赶地铁回来参加TX的笔试题。但实际上我一面已经挂了,结果现在才出来,这题就没必要做了实际上,而且五题只做出来第一题,似乎打竞赛的才能做得出来多题,唉…
又和SH打了一会儿大乱斗
看小说,睡觉!