DailyRecord-April
4.1上午,把qwenllm/qwen的docker image放到服务器上了,但是下午发现模型没放,还要下载72b-chat的模型再放上去;而且这个东西好像要自己写应该服务端py文件?下午复习了一下long-context的论文,看了retrieval的一些如longllama,温故知新,没跳出已有框架的同时,感觉理解更深了晚上,和SH打了一把游戏,然后和沈老师开周会,汇报了一下自己目前的一些理解。得到下一步的研究内容是:把retrieval 的方式在大模型上都实现一下之后,继续和SH、NJ一起打了大乱斗
虽然是愚人节,但是无事发生
明日任务:阅读论文;学习修改大模型的方法
4.2 草!这一天干啥了我给忘了!原来日记漏了一天,4.8才发现! 好像还是在看代码和教程?
4.3上午,阅读qwen的model_qwen.py文件,尝试理解模型结构,寻找修改方法。最终目的是将kv retrieval加入到模型中去;目前没什么头绪,是直接改model文件,还是写个新的继承一下?继承的话如何与已有文件保持联系和交互?qwen的py代码没有啥注释,突然想到可以看一下tran ...
DailyRecord-March
3.20入职的第一天,接到的任务是:把闻达的demo在服务器上用docker给搭建出来。于是我在服务器上先创建了一个miniconda3的docker,然后使用conda安装了一些依赖、git项目等;其间遇到一个问题:docker+conda后,尽管bash上显示是root,但是好像是一个虚拟的root,没有sudo等的执行文件,需要重新安装一下。此外,公司的网有点差,清华源1Mb、不用清华源只有几十kb。因而进展较慢部署步骤进行到了模型下载这一步,但是因为网不好所以连不上hugging face,需要搭梯子。下班了,明天再搞!
明日任务:搞定梯子,下载好生成模型和embedding模型,最终完成demo,并调整远程访问展示
3.21今天签合同了。搭梯子问题卡了好久😡。这国企是一天也不能待了,网差的要死。最后还是前辈哥帮忙解决的。但是terminal的命令,下载的那些怎么都那么几把慢啊!网速是压力之源!更悲剧的是:今日闻达demo部署至最后一步无法运行…………..可能是docker的问题,因而将其删除从头开始搭建。如果明天仍然不行,则尝试不用docker直接在服务器上部署 ...
第一次实习前的一些准备工作与知识储备
千帆杯原生应用挑战赛
大赛主旨:大赛以“创意无限·生成未来”为主题,紧密围绕当前AI技术的前沿动态和应用趋势,借助百度智能云千帆AppBuilder和ModelBuilder两大智能开发助手,鼓励参赛者打造出更多具有创新性、实用性和社会价值的AI原生应用
第一期:游乐场排队规划助手:赛题聚焦春节假期游乐园排队效率问题,鼓励开发者利用 AI 能力施展“时间魔法”,打造一款具有实用性的“游乐场排队规划助手”,帮助游客更好地了解乐园的排队情况,设计个性化的游玩路线,在有限的时间内获得最“High”的体验,同时为管理者提供优化运营策略的决策支持。
此大赛没有规定数据集,需求成果是使用主办方框架的应用程序。参赛者需要自己获取相关数据,如大赛第一名使用的是香港迪士尼数据
第二期:生成一个可制作贺岁文案内容的精调模型(限定使用ERNIE Speed,通过对模型精调使其保持原有能力的同时,具备准确理解并执行文案创作中创作长度相关指令的能力)。
此大赛提供了少量数据集(56)条,同时要求对数据集进行扩展(最终至少需要100条数据),数据为json形式
与第一期不同,此期是方向特化的微调 ...
云服务器使用及QQ机器人搭建
1. 服务器选择三个主流的:阿里云、腾讯云、华为云。萌新的我需要三选一华为云没用过。阿里云学生认证可以白嫖,腾讯云学生认证是打折,看着蛮便宜,但是这个时间买是1.9折,去年11月是1.1折。
服务器使用阿里云,因为可以白嫖7个月,新手上路还是找免费的试一下比较好,随便造,造坏了也不心疼。
cpu、内存这些东西就是看钱的啦,根据需要购买合适的就行。系统这个东西,不太清楚是怎么选择的。本人选择Ubuntu的依据是:尽管windows很熟悉,但是几个资深程序员的哥们儿用的都是Linux内核系统;此外,Liunx相对于windows的内存占用要小太多了,服务器还是要抠抠搜搜一点。Linux提供服务好像也蛮方便的
2. 服务器操作跟着阿里的教程走下来,基本上就会怎么操纵服务器了。远程连接服务器有两种方式:Workbench和VNC,前者似乎只能用命令行输入,后者则可以安装GUI。
实际上,不同云服务商对于自己云服务器的名称和操纵方式是有所不同的。
3. 图形界面的安装我的一个朋友对我说,只有当你能够用命令行完成你想要的所有操作后,你才算是真正懂计算机,我觉得很有道理。目前还没有这个能力,先用带G ...
AI绘画初步尝试:Stable Difussion本地部署及WebUI使用
1. 安装conda、git、cudaCuda版本需要首先查看自己nvida显卡参数,不能高于参数上的版本
2. Conda创建环境,python版本根据GitHub上的说明来选择
1`conda create --name sdweb python=3.10.6`
3. 进入创建的虚拟环境1`conda activate sdweb`
4. 在虚拟环境下克隆项目,注意:命令行需要cd到虚拟环境的目录,不然会默认git到c盘….1`git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git`
实际上好像在哪里都无所谓?但是部署在这个位置的时候,运行.bat的时候,命令行显示的是:
123`Creating venv in directory D:\Anaconda3\envs\sdweb\stable-diffusion-webui\venv using python "D:\Anaconda3\python.exe"``venv "D:\Anaconda3\envs\s ...
记录自己的初次搭建博客的经历——流程、路径与感悟
安装流程可以参见 这篇文章部署时尤其需要注意的设置:将hexo设置里面的分支名称改成与GitHub一致,因为前两年GitHub把main branch名字改了..
1.网站部署的原理和逻辑是什么?在最开始,面对各种搭建网站的框架,本人其实是迷茫的,因为我一时间无法理解为什么经过这些步骤就能够产出一个可以被访问的页面?直到我在站点快搭建完成时,我才突然明白其原理,或许接下来的要说理解有点不准确,但是仍然在这里记录一下:
首先,需要理解的就是,网络上所有的资源都是以二进制的方式传输的,网站也是这样,传输的是010101的数据流,而不是直接将页面呈现在电脑上。数据在经过网络传输至本地的时候,需要本地利用某种“解码软件”将其转换成更高级的、便于用户阅读、输入的模式。浏览器其实就是将01数据解析成html等代码,然后再通过渲染、代码执行,将数据以GUI的形式呈现出来的解析器。
那么,为什么可以将页面文件夹的一整个数据包托管至某个服务器,从而能够对外可见呢?在GitHub中,如果你建立一个仓库,并将网站数据上传至仓库,利用GitHub Pages功能就可以将个人博客发布在互联网上。实际上,通 ...
YukinoのBlog
这是搭建自己第一个博客后的第一篇文章
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
Quick StartCreate a new post1$ hexo new "My New Post"
More info: Writing
Run server1$ hexo server
More info: Server
Generate static files1$ hexo generate
More info: Generating
Deploy to remote sites1$ hexo deploy
More info: Deployment