EIGHTJIU

发表于2026-03-14

LoRA是什么？LoRA（Low-Rank Adaptation）是一种用于微调大模型（LLM / Diffusion / Transformer）的技术。冻结原始模型参数，只训练一个低秩矩阵来表示权重更新。这样可以让权重变化 ΔW 不需要完整矩阵，在极少训练参数的情况下，让模型学到新任务能力。为什么需要？lora的设计亮点参数少，速度快，模块化模块化的本质： LoRA 将“任务能力”封装成一个独立的参数模块，可以在不改变原模型的情况下加载或卸载。在代码层面 LoRA 是一个外挂模块： 1234567Base Model │ ├── W (冻结权重) │ └── LoRA Module ├── A └── B 训练时： 1只训练 LoRA Module 推理时： 1Base Model + LoRA 可以随时加载/卸载能力例如一个基础模型： 1LLaMA 不同能力可以变成不同 LoRA： 123456base_model │ ├── finan...

Scaling Law

发表于2026-03-09

Scaling LawScaling Laws for Neural Language Models Chain of Thought (CoT) 是让模型把逻辑推导过程写出来 Instruction Tuning 是教模型听懂并执行人类指令 Scratchpad 就是给模型一块“草稿本”，让它在最终输出答案前先在大脑（上下文）里打草稿。 CoT (思维链)：是行为方式，像是在说“请步步为营地思考”。 Instruction Tuning (指令微调)：是训练手段，通过海量“指令-回复”对让模型变乖、变聪明。 Scratchpad (草稿纸)：是技术实现，通过在输出中强制包含中间步骤，利用已生成的 Token 来辅助生成后续更复杂的 Token（即“以空间换逻辑”）。 Scratchpad 定义Scaling Law（规模法则）是 AI 界的“大力出奇迹”指南。它告诉我们：如果你投入更多的算力、更多的数据、更大的模型参数，AI 的性能就会预测性地变得更强。它揭示了模型性能并不是随机增长的，而是遵循严格的数学幂律关系。为什么要学这个？理解 Scaling Law 能...

RUST笔记一(基础与变量)

发表于2026-03-09

RUST-基础与变量第一章：基础入门与环境配置🔧 核心概念：CargoCargo 是 Rust 的构建系统和包管理器（类似 npm/pip）。常用命令： cargo new project_name：创建新项目 cargo build：编译项目 cargo run：编译并运行（日常开发最常用） cargo check：快速检查语法错误（不生成二进制文件，速度快） 📁 项目结构Plaintext 1234567hello_cargo/├── Cargo.toml # 项目配置文件（依赖、元数据）├── src/│ └── main.rs # 源代码入口└── target/ # 构建输出目录（自动生成） └── debug/ └── hello_cargo # 编译后的可执行文件 💻 VS Code 远程开发 (Remote-SSH) 🔥推荐方案：直接在云服务器上开发。扩展：安装 Remote - SSH。连接：Ctrl+Shift+P -> Remote-SSH: Connect...

aboutRAG

发表于2026-03-08

RAG的定义给定知识库，从知识库中检索出合适的参考内容，让大模型据此回答。 AI客服|政策查询|AI搜索 RAG（Retrieval-Augmented Generation）是将检索外部知识库与大语言模型（LLM）生成相结合的技术，核心是让LLM基于精准的参考知识回答问题，避免幻觉。简易流程简易流程可分为知识库构建（离线阶段）和问答推理（在线阶段）两大核心环节，具体分点详解如下：一、知识库构建阶段（离线准备，核心是将原始知识转化为可检索的向量数据）该阶段为后续问答提供数据支撑，完成后知识将以向量形式存储在数据库中，具体步骤：原始知识输入准备需要用于问答的基础信息（如产品保修条款、专业文献、行业资料等），作为RAG流程的数据源。切割器处理：生成知识块利用切割器将海量、完整的原始知识拆分为大小适中、逻辑独立的知识块。 ◦ 作用：解决原始知识篇幅过长、无法被模型高效处理的问题，让检索更精准。 Embedding模型处理：生成文本向量将拆分后的知识块输入Embedding（嵌入）模型，模型会将非结构化的文本知识转化为计算机可识别的数值型文本向量（如...

Polymarket_learning

发表于2026-02-13

爬虫学习

发表于2026-02-08

以爬取 Binance Research 为例的 Python 爬虫系统学习一、学习目标与背景本文以爬取 https://www.binance.com/zh-CN/research 为例，系统学习一个真实可运行的 Python 爬虫项目，目标包括：正确分析接口而非盲目爬 HTML 自动判断分页数量，彻底摆脱 range(1,6) 正确处理 JSON / 非 JSON 响应理解并应对 403 反爬构建健壮、可扩展的爬虫结构二、为什么不能直接爬 HTML 页面1. 问题本质Binance Research 页面是前端渲染页面： HTML 中几乎没有文章数据真实数据来自后端 API 接口浏览器通过 JavaScript 请求接口并渲染 2. 正确做法打开浏览器开发者工具（F12）切换到 Network → Fetch/XHR 翻页观察请求变化定位返回 JSON 的接口三、接口分析与分页机制1. 核心接口示例1https://www.binance.com/bapi/composite/v1/public/cms/article/...

Prompt优化技巧（一）

发表于2026-02-05

原文链接： https://mp.weixin.qq.com/s/3CmpCz2jrjGG2q44qMHf6g 本文收集并总结此文中prompt 优化技巧，从 prompt 运行过程探究一个优秀的 prompt应该如何写作。 Prompt的运行过程1. 输入与终端捕获当你把Prompt丢给模型时，系统就开始了第一步：解析你的“子台词”。无论是任务指令还是背景背景，模型都会将其视为一个待处理的原始信号，从而后续生成的边界。 Prompt 可以是：“写一篇关于气候变化的文章，包括其原因、影响和解决方案。” 2. 文本分拆与数字化编码句子模型无法直接读取字符，因此需要进行Tokenization（分词）。将你的拆解成最小语义单元（Tokens），将其映射为一串Token ID。这些数字附加进入嵌入层，转化为高维空间的处理，让文字变成计算机能处理的数学特征。 3. 核心计算：Transformer架构的逻辑推演这是模型“思考”的最深层，变压器神经网络中的数据经历了一系列复杂的化学反应：注入位置信息：由于模型本质上是零件的，它必须通过位置编码（位置编码）给每个Token标记“...

Skills

发表于2026-02-04

原文：https://mp.weixin.qq.com/s/VQSRPTf5bOyA1bjS2JH5Kw skills做知识库检索原文：https://mp.weixin.qq.com/s/9QT1R0vRQAV2bxLeLljifw 定义简单说，Skills 的作用就是将那些重复性的、专业的流程进行打包封装。当你需要使用某种能力时，不再需要像过去那样每次都去查阅手册或重新输入冗长的提示词，而是像调用工具一样直接使用。 Agent Skills提供模块化能力插件，相当于安装外接工具箱+工具使用说明。介绍每个 Skill 都是一个实实在在存在的文件夹，它存放在一个固定的位置（如 .claude/skills）这个文件夹里装着下面几样东西：指令（SKILL.md）：告诉 AI 怎么干活的 SOP。参考（reference）：更详细的参考文档（可选）。脚本（scripts）：比如 Python 代码，让 Skill 也能调用外部能力（可选）。资源（assets）：图片、模版等可能使用到的资源（可选）。类比：import xxx来引入外部包内容 ...

WSL中与DNS相关的问题

发表于2026-01-13

WSL中与DNS相关的问题场景：配置claude code 一、问题一：curl / npm / apt 报错，提示域名无法解析问题 curl: Could not resolve host npm ERR! getaddrinfo EAI_AGAIN apt: Temporary failure resolving 'archive.ubuntu.com' 原因 WSL 内部的 DNS 解析不稳定 / 失败常见于： WSL2 网络初始化异常 DNS 被代理 / 网络环境干扰系统在 IPv6 / IPv4 间切换导致解析异常答案先验证 DNS 是否真的失效： 12getent hosts google.comgetent hosts registry.npmjs.org 若能解析但应用报错，通常不是 DNS 本身，而是后续网络出口问题必要时重启 WSL： 1wsl --shutdown 二、问题二：npm 能访问，但 Claude Code 仍然无法连接问题 claude 报错： 1...

AI名词扫盲

发表于2025-12-30

一、初始AI模型交互与提示词演进1.1 用户提示词（User Prompt）定义：用户发送给AI模型的消息，通常是问题或意图表达。局限性： AI模型缺乏预设“人设”“背景”；回答通用、中规中矩，无个性化和趣味性；无法根据上下文/角色给出差异化反馈。 1.2 系统提示词（System Prompt）产生背景：解决AI模型缺乏人设的问题，避免将人设与用户请求打包导致内容不自然。定义：把人设、性格、背景、语气等非用户直接说出的内容独立出来的提示信息。机制：网页/聊天机器人中，系统会自动将其与用户提示词一同发送给AI模型。应用场景：部分端侧系统预设的系统提示词用户无法直接修改；部分平台（如ChatGPT）自定义偏好会自动整合为系统提示词的一部分。二、AI智能体（AI Agent）及其工具（Agent Tool）2.1 AI Agent的引入需求背景：AI模型仅能提供答案/操作建议，无法自主执行任务。概念： AI Agent：协调AI模型、工具与最终用户的通信程序； Agent Tool：供AI模型调用的本地小程序/服务...