avatar
文章
87
标签
13
分类
0
Home
Archives
Search
List
  • link
  • star
  • About
EIGHTJIUPolymarket_learning 返回首页
Home
Archives
Search
List
  • link
  • star
  • About

Polymarket_learning

发表于2026-02-13|更新于2026-02-13
|浏览量:
文章作者: kizy
文章链接: https://kizzy899.github.io/2026/02/13/Polymarket-learning/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 EIGHTJIU!
cover of previous post
上一篇
aboutRAG
RAG的定义给定知识库,从知识库中检索出合适的参考内容,让大模型据此回答。 AI客服|政策查询|AI搜索 RAG(Retrieval-Augmented Generation)是将检索外部知识库与大语言模型(LLM)生成相结合的技术,核心是让LLM基于精准的参考知识回答问题,避免幻觉。 简易流程 简易流程可分为知识库构建(离线阶段) 和问答推理(在线阶段) 两大核心环节,具体分点详解如下: 一、知识库构建阶段 (离线准备,核心是将原始知识转化为可检索的向量数据) 该阶段为后续问答提供数据支撑,完成后知识将以向量形式存储在数据库中,具体步骤: 原始知识输入准备需要用于问答的基础信息(如产品保修条款、专业文献、行业资料等),作为RAG流程的数据源。 切割器处理:生成知识块利用切割器将海量、完整的原始知识拆分为大小适中、逻辑独立的知识块。 ◦ 作用:解决原始知识篇幅过长、无法被模型高效处理的问题,让检索更精准。 Embedding模型处理:生成文本向量将拆分后的知识块输入Embedding(嵌入)模型,模型会将非结构化的文本知识转化为计算机可识别的数值型文本向量(如...
cover of next post
下一篇
爬虫学习
以爬取 Binance Research 为例的 Python 爬虫系统学习一、学习目标与背景本文以爬取 https://www.binance.com/zh-CN/research 为例,系统学习一个真实可运行的 Python 爬虫项目,目标包括: 正确分析接口而非盲目爬 HTML 自动判断分页数量,彻底摆脱 range(1,6) 正确处理 JSON / 非 JSON 响应 理解并应对 403 反爬 构建健壮、可扩展的爬虫结构 二、为什么不能直接爬 HTML 页面1. 问题本质Binance Research 页面是前端渲染页面: HTML 中几乎没有文章数据 真实数据来自 后端 API 接口 浏览器通过 JavaScript 请求接口并渲染 2. 正确做法 打开浏览器开发者工具(F12) 切换到 Network → Fetch/XHR 翻页观察请求变化 定位返回 JSON 的接口 三、接口分析与分页机制1. 核心接口示例1https://www.binance.com/bapi/composite/v1/public/cms/article/...

评论
avatar
kizy
rainbow
文章
87
标签
13
分类
0
my github
公告
Sampre avanti
-899