type
status
date
slug
summary
tags
category
icon
password
看本课程之前可以看下openAI官方的微调教程,本课程全程借助ChatGPT的能力协助一起完成。
费话不多说,先说重点,微调之前,先买好OpenAI的API额度保姆级开通OpenAI API和ChatGPT Plus教程(macOS版)我微调到一半,一直报错,原来免费额度不能用于微调,囧。

前景

众说周知,大厂的大模型调教很多直接购买OpneAI的API,照着同样的问题调教回答,和算法。
每个月大几十上百万的支出,就是为了参照现业内最强大模型的标准,既然大厂都这样做,那我们这些小的开发人员去依靠OpneAI的API去开发产品,APP也是理所当然了(注:G企Y企企业不允许OpneAI的API的应用或者产品进入系统内部)

教程

第一步:准备训练集

我用了一种比较偷懒的方式去准备训练集,整个流程是这样的
  • 找到一些视频或者文字资料,复制链接
  • 给到ChatGPT链接,让他总结文字内容
    • 使用的是GPT4和插件:YT Summarizer(用于总结视频内容)Browserop(用于浏览网页)
  • ChatGPT根据文字内容转化成训练集的.XSONL格式
 
 
因为我这里只是做教学示范,所以用与训练的训练集内容不多,下面是训练集的代码格式,复制后再去修改成自己的内容

第二步:搭建环境

在终端或者Visual Studio Code编辑器里创建一个date.py文件,代码直接复制,替换自己的YOU_OPENAI_KEY/Users/heyihui/Downloads/个人项目/llm微调测试/X.jsonl路径文件
 
运行终端会出现以下结果,需要复制file-cVLy8LcFdgVpRxRtsXbb3eJn
进行下一步
notion image
 
创建finetune.py文件,输入以下代码,替换YOU_OPENAI_KEYfile-cVLy8LcFdgVpRxRtsXbb3eJn
运行文件,等待OpenAI的官方邮件

第三步:测试微调模型

等微调成功,OpenAI会发送一份邮件,里面会有新模型的ID(黄色高亮的是ID),复制ID
notion image
 
创建runmodel.py文件,复制以下代码,替换YOU_OPENAI_KEY和模型ID:ft:gpt-3.5-turbo-0613:hyh2::7t9zP397这里需要提供完整的ID,而不是gpt-3.5-turbo-0613:hyh2::7t9zP397
其中 messages=[...]: 提供一个消息列表来与模型交互。每个消息都有一个角色(role)和内容(content)。在这个例子中,首先是一个系统消息,告诉模型它是一个乐于助人的创业助理,拥有丰富的创业知识,可以指导问你问题的人,内容为"Hello!创业者"。
运行文件
成功运行结果会出现
notion image
 
也可以在OpenAI的playground去测试,在Model选项选择微调好的模型
notion image
notion image
 

💡
👉平时我会在知乎,博客网站上更新文章,B站更新长视频,抖音更新短视频,喜欢我的可以关注社媒 知乎GitHub B站抖音
 
保姆级开通OpenAI API和ChatGPT Plus教程(macOS版)跨境电商老板必读:如何有效地融入AI用于业务增长