type
status
date
slug
summary
tags
category
icon
password
看本课程之前可以看下openAI官方的微调教程,本课程全程借助ChatGPT的能力协助一起完成。
前景
众说周知,大厂的大模型调教很多直接购买OpneAI的API,照着同样的问题调教回答,和算法。
每个月大几十上百万的支出,就是为了参照现业内最强大模型的标准,既然大厂都这样做,那我们这些小的开发人员去依靠OpneAI的API去开发产品,APP也是理所当然了(注:G企Y企企业不允许OpneAI的API的应用或者产品进入系统内部)
教程
第一步:准备训练集
我用了一种比较偷懒的方式去准备训练集,整个流程是这样的
- 找到一些视频或者文字资料,复制链接
- 给到ChatGPT链接,让他总结文字内容
- 使用的是GPT4和插件:YT Summarizer(用于总结视频内容)Browserop(用于浏览网页)
- ChatGPT根据文字内容转化成训练集的.XSONL格式
因为我这里只是做教学示范,所以用与训练的训练集内容不多,下面是训练集的代码格式,复制后再去修改成自己的内容
第二步:搭建环境
在终端或者Visual Studio Code编辑器里创建一个date.py文件,代码直接复制,替换自己的
YOU_OPENAI_KEY
和/Users/heyihui/Downloads/个人项目/llm微调测试/X.jsonl
(路径文件)运行终端会出现以下结果,需要复制
file-cVLy8LcFdgVpRxRtsXbb3eJn
进行下一步
创建finetune.py文件,输入以下代码,替换
YOU_OPENAI_KEY
和file-cVLy8LcFdgVpRxRtsXbb3eJn
运行文件,等待OpenAI的官方邮件
第三步:测试微调模型
等微调成功,OpenAI会发送一份邮件,里面会有新模型的ID(黄色高亮的是ID),复制ID
创建runmodel.py文件,复制以下代码,替换
YOU_OPENAI_KEY
和模型ID:ft:gpt-3.5-turbo-0613:hyh2::7t9zP397
(这里需要提供完整的ID,而不是gpt-3.5-turbo-0613:hyh2::7t9zP397
)其中
messages=[...]
: 提供一个消息列表来与模型交互。每个消息都有一个角色(role
)和内容(content
)。在这个例子中,首先是一个系统消息,告诉模型它是一个乐于助人的创业助理,拥有丰富的创业知识,可以指导问你问题的人,内容为"Hello!创业者"。运行文件
成功运行结果会出现
也可以在OpenAI的playground去测试,在Model选项选择微调好的模型
- Author:何艺汇
- URL:https://github.com/murenren1/article/b7e71761-bf2b-4bf3-9364-e08b1c91c7d7
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts