.env文件和.gitignore 当我们在使用API_KEY、数据库密码,或者是在设置http_proxy的时候,往往不希望把这样的隐私信息上传到github中,那么怎么忽视这些信息呢? 有一个办法是使用 .env文件来存储这些敏感信息。具体步骤如下所示: 创建一个.env文件,并添加内容: 12API_KEY=your_api_key_herePASSWORD = PASSWWWW 安装python-dotenv库: 2024-10-26 Research Basic #Git
微调策略对比 NLP大作业,选择了一个关于模型微调的题目,浅学了一下模型的微调策略,在这里介绍两种策略:全量微调和LoRA。 why fine-tuing? 当大模型完成pretrain之后,它在各个方面都具备了一定的能力。但是比方说我想要提升模型在某一个方面的能力,例如代码能力,我就需要对模型进行微调,让模型的代码能力更加优秀。 LLM的背后是海量的参数,这些参数以矩阵的形式存储,我们在微调的时候,其实 2024-10-19 Research Basic #fine-tuning
Docker学习 很久之前就下载了Docker,但是因为种种原因一直搁置,也没有学习,今天一起来学一学吧~😄😄 ## Docker介绍 Docker是一个开源平台,允许开发者打包、分发和运行应用程序容器,使用容器来隔离应用程序和以来项,使得应用能够在不同环境中一致运行。 在和Skyee聊天的时候,她说她用的是Docker Compose,这是一个工具,使得用户可以一次性启动、停止和管理多个Docker容 2024-09-30 Research Basic #Docker
git几步曲 这里记录一些git的非常基本基本的操作,主要用于管理个人的小项目。没错非常简单,但我就是记不住然后每次左向箭头找到历史。。 Git上传基本操作 初始化git仓库 1git init 这个命令会在当前目录下创建一个git仓库,并初始化一个空的提交记录,只需要在最初始的时候使用该命令。 检查git状态 1git status 这个命令会显示工作目录和暂存区的状态,包括哪些文件已更改、哪些 2024-09-30 Research Basic #Git
learn_about_humanEval 在这里记录一下评估模型代码生成能力常用的Benchmark:humanEval HumanEval 数据集是 OpenAI 为评估代码生成模型而创建的一个数据集,专门用于测试模型的编程能力。该数据集中一共有164条数据,均以python书写。 数据格式 举例一条数据如下: 1234567{ "task_id": "HumanEval/163&quo 2024-09-18 Research Basic > Image2Code #Benchmark
Basic Knowledge for Domain Generalization 🌞🌞有幸接触到一个做域泛化的项目组,在准备期间看论文发现自己机器学习、深度学习的基础其实一点都不扎实🥹🥹,在这里记录一下跟进项目需要用到的知识点! ### 域自适应[Domain Adaptation] VS 域泛化[Domain Generalization] 以一个具体的场景为例: 假设我在开发一个自动驾驶系统,它需要识别街道上的行人。我在A城市收集了大量的行人图像(源领域),我 2024-09-04 Research Basic #Machine Learning #Deep Learning