第一部分:引言与基础
-
课程介绍
- 培训目标与预期成果
- 课程安排与学习方法
- 学员自我介绍与期望
-
大模型概述
- 大模型的定义与发展历程
- 大模型的应用场景与前景
- 现有大模型的比较(如 GPT-3、BERT、T5 等)
- 参考资料:
- LLM Cookbook ⁶
- 大模型基础知识 ⁷
第二部分:Ollama 部署本地大模型
-
Ollama 简介
- Ollama 的功能与优势
- Ollama 的应用场景
- Ollama 与其他部署工具的比较
-
Ollama 的安装与配置
- 系统要求与准备工作
- 安装 Ollama(macOS、Windows、Linux)
- 配置与启动 Ollama 服务
- 常见安装问题与解决方案
- 参考资料:
- Ollama 部署指南 ¹
- Ollama 实战 ²
-
Ollama 的使用
-
部署与运行模型
-
常用命令与操作
-
使用 REST API 与编程语言库(如 Python 和 JavaScript)
-
示例代码:
import requests url = "http://localhost:11434/api/v1/predict" payload = { "model": "your_model_name", "input": "Hello, world!" } response = requests.post(url, json=payload) print(response.json())
-
参考资料:
-
第三部分:大模型的训练与优化
-
大模型的训练
- 数据准备与预处理
- 训练流程与方法
- 使用框架与工具(如 TensorFlow、PyTorch)
- 常见问题与解决方案
- 参考资料:
-
大模型的优化
- 模型参数调整与优化技巧
- 使用工具与框架进行优化(如 Hugging Face Transformers)
- 性能评估与改进
- 参考资料:
- 大模型训练和推理优化技术 ¹⁵
- 大模型 RAG 优化方案 ¹⁶
第四部分:Prompt 工程与优化
-
Prompt 工程概述
- Prompt 的定义与重要性
- Prompt 工程的发展历程
- Prompt 工程的基本原则
-
Prompt 优化技巧
-
常用的 Prompt 优化方法(如 APE、OPRO、EVOPROMPT 等)
-
自动化 Prompt 优化工具与方法
-
实践案例与效果评估
-
参考资料:
- 提示工程指南 ¹¹
- 自动优化 Prompt 的方法 ¹²
-
示例代码:
from transformers import pipeline generator = pipeline('text-generation', model='gpt-3') prompt = "Once upon a time" response = generator(prompt, max_length=50) print(response)
-
第五部分:高级主题与实战
-
自定义模型
-
定制化模型的必要性
-
使用 Modelfile 定制模型参数与行为
-
训练与微调自定义模型
-
示例代码:
from transformers import Trainer, TrainingArguments training_args = TrainingArguments( output_dir='./results', num_train_epochs=3, per_device_train_batch_size=4, per_device_eval_batch_size=4, warmup_steps=500, weight_decay=0.01, logging_dir='./logs', ) trainer = Trainer( model=model, args=training_args, train_dataset=train_dataset, eval_dataset=eval_dataset ) trainer.train()
-
-
多模态模型支持
- 多模态数据的处理与分析
- 多模态模型的应用场景
- 参考资料:
-
实战项目
- 项目选题与需求分析
- 项目实施与调试
- 项目展示与评估
- 团队合作与项目管理技巧
第六部分:总结与展望
-
课程总结
- 关键知识点回顾
- 学习成果展示
- 学员反馈与讨论
-
未来展望
- 大模型技术的发展趋势
- 未来学习与研究方向
- 资源推荐与学习路径
- 参考资料:
(1) 面向开发者的大模型手册 - LLM Cookbook - GitHub. https://github.com/datawhalechina/llm-cookbook.
(2) datawhalechina/so-large-lm: 大模型基础: 一文了解大模型基础知识 - GitHub. https://github.com/datawhalechina/so-large-lm.
(3) LLM大模型部署实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发. https://www.cnblogs.com/ting1/p/18358286.
(4) 本地部署大模型?看这篇就够了,Ollama 部署和实战 - CSDN博客. https://blog.csdn.net/m0_59235699/article/details/141143682.
(5) Ollama:本地大模型运行指南 · 十月指南. https://www.oct.cool/blog/ollama%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B%E8%BF%90%E8%A1%8C%E6%8C%87%E5%8D%97/.
(6) 太通透了!大模型训练和推理优化技术最全汇总! - 知乎专栏. https://zhuanlan.zhihu.com/p/678884007.
(7) 这是我见过的大模型 RAG 优化方案与实践最全总结了 - CSDN博客. https://blog.csdn.net/2401_84033492/article/details/140058931.
(8) 提示工程指南 | Prompt Engineering Guide. https://www.promptingguide.ai/zh.
(9) 自动优化Prompt:Automatic Prompt Engineering的3种方法. https://developer.volcengine.com/articles/7404769142999515162.
(10) 大模型综合评测对比 | 当前主流大模型在各评测数据集上的表现总榜单 | 数据学习 (DataLearner). https://www.datalearner.com/ai-models/leaderboard/datalearner-llm-leaderboard.
(11) 大模型必读|A16z精心整理的最全AI学习资料(全文中译+链接) - 智源社区 - baai.ac.cn. https://hub.baai.ac.cn/view/27221.
(12) ollama 最快方式部署管理大模型 - 夜半钟声到客船 - 博客园. https://www.cnblogs.com/hejunhong/p/18387073.
(13) Ollama 本地开源大模型聊天应用前言 如果您想在localhost部署并运行开源大模型,可以试试Ollama。本文我 - 掘金. https://juejin.cn/post/7346919387351859234.
(14) 【2024最新】大模型训练:从整体规划到训练自己专属大模型!北大博士后卢老师授课 涵盖技术选型 基础框架 .... https://www.bilibili.com/video/BV1Vx421m7r7/.
(15) 【大模型LLM第三篇】Prompt资源最全整合(学习资料、模版开源、自动优化以及好玩的网站)涉及ChatGPT等.... https://blog.csdn.net/qq_33431368/article/details/136834229.
(16) wangxuqi/Prompt-Engineering-Guide-Chinese - GitHub. https://github.com/wangxuqi/Prompt-Engineering-Guide-Chinese.
(17) undefined. https://ollama.com/.
(18) undefined. https://curl.se/ca/cacert.pem.
(19) undefined. https://ollama.com/install.sh.
(20) undefined. https://ollama.fan/getting-started/linux/.
(21) undefined. https://ollama.com/download/ollama-linux-amd64.
(22) undefined. https://github.com/ollama/ollama/releases/.
(23) undefined. https://github.com/ollama/ollama/blob/main/docs/faq.md.
(24) undefined. https://ollama.com/download/Ollama-darwin.zip.
(25) undefined. https://ollama.com/download/OllamaSetup.exe.
(26) undefined. https://github.com/ollama/ollama.
(27) undefined. https://ollama.com/library/llama3.1.
(28) undefined. https://llama.meta.com/llama3/.
(29) undefined. https://github.com/ollama/ollama/blob/main/docs/api.md.
(30) undefined. https://dev.to/wydoinn/run-llms-locally-using-ollama-open-source-gc0.
(31) undefined. https://prompt-guide.xiniushu.com/category/-basics.
(32) undefined. https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/.