AI

  • 项目目的: AI相关玩法的笔记总结

资源站点

  • 网页转markdown: https://r.jina.ai/
  • api
    • https://openrouter.ai/api/v1
      • ██-██-██-████████████████████████████████████████████████████████████████
      • deepseek/deepseek-r1:free
    • https://api.deepseek.com
      • ██-████████████████████████████████
  • 图站
  • 菜谱站
  • ollama权限校验
    • one api:
      • docker run --name one-api -d --restart always -p 3002:3000 -e TZ=Asia/Shanghai -v /opt/one-api:/data justsong/one-api
      • 密钥: ████████████
      • 令牌: ██-████████████████████████████████████████████████

AI能力测试

  • 骑着电动车回家,在无人的巷子里飙车。突然对面冲出一个大叔,也骑的飞快。眼看就要撞起了。大叔吼道:"你左!我右!"这个笑话的笑点在哪里?
    • gemma: 慢
    • deepseek: 1, 推理对了, 第二次错了 2, 不支持使用nothink关闭推理 3, 运行快
    • qwen: 1, 推理重复好多次, 好像是对了 2, /nothink关闭思考后完全对了
  • 下列选项中,找出与众不同的一个:1.铝 2.锡 3.钢 4.铁 5.铜
    • qwen3(无思考)和deepseek都对了, gemma也对了/还是超慢
  • 树上有9只鸟,猎人开枪打死1只,树上还剩几只鸟?
    • 答案: 不剩鸟
    • deepseek推理对了, 最终保守回答8只/错了
  • 观察下列个数:1、2、4、8、16......试按此规律写出第11个数
    • 答案: 1024
  • 3个人3天喝了3桶水,9个人9天喝了几桶水
    • 答案: 27
    • gemma上面问题全对
    • qwen3又快又好. /nothink按需要去设置, 且基本没影响/不思考也很好
  • 货拉拉拉不拉拉布拉多?
    • qwen/nothink正常对了
    • deepseek也对了
  • https://juejin.cn/post/7469713532331753491 -> 计算能力
    • 现有一个炸弹,启动后,其第一秒爆炸的概率是 1%;若第一秒未爆炸,则第二秒爆炸的概率为 2%;若前面未爆炸,则第三秒爆炸的概率为 3% ...... 若前面未爆炸,则第100秒爆炸的概率为100%。问启动后,炸弹最有可能在第几秒爆炸?
      • 答案: 10秒
      • qwen/nothink: 40s
      • qwen: 思考版本: 解方程得9或10. 然后验算了很长时间/超长时间. 之后上下文就已经丢了/跑飞了, 然后回答1...
      • deepseek: 也是一会之后解出10. 然后验算很长时间(计算过程占据超多token):
        • "经过详细的计算和分析,我们确定炸弹最可能在第10秒爆炸。这是因为在这个时间点,累积的概率达到了最高值,之后随着每一秒的过去,概率开始下降。因此,最佳的干预时机是在第10秒"
      • gemma3不带tools机制, 上限卡死
      • qwen3-30b: 12秒
        • 就算超gpu显存, 实际输出仍然飞快/毫无区别
      • qwen/nothink-14b, 结合python工具, 直接精确给出正确回答
  • 关于ai工具调用:
    • openwebui支持, 使用python工具, 基本能胜任大多数任务
    • 验算是否调用了工具:
      • 计算 [[1,2],[3,4]] 的 20 次幂
  • 某密码锁有三个数字位,每个数字位可以是0到9之间的任意数字。请根据以下四个提示推断出正确的三位数密码: 提示1: 在数字组合318中,有且只有一个数字不仅存在于密码中,而且位置也正确。其余数字均错误 提示2: 在数字组合379中,有且只有一个数字存在于密码中,但位置不正确。其余数字均错误 提示3: 在数字组合863中,有且只有两个数字存在于密码中,但位置均不正确。其余数字均错误 提示4: 在数字组合421中,没有任何一个数字存在于密码中。 请根据以上提示,推断出正确的三位数密码
    • 30b-a3b-instruct: 有时能答出来, 有时答不出来(完全卡死/一直运转)
  • 关于ollama: 4分30s后自动卸载显存占用
  • 30b-a3b比14b聪明超多
  • 10轮随机记忆测试样例:
    • 记住:蓝鲸
    • 记住:42
    • 记住:纸飞机
    • 记住:XQ7
    • 记住:咖啡杯
    • 记住:橙子
    • 记住:1999
    • 记住:黑猫
    • 记住:Y轴
    • 现在请告诉我,我之前依次让你记住的所有内容是什么?

AI编程

  • AI读代码
    • 豆包marscode
    • DeepWiki
  • 关于不同的windsurf模型:
    • 涉及3个文件以上, 200行往上 -> claude sonnet4是唯一选
    • 单文件, 200行往下 -> qwen coder
    • 其他:
      • gemini大量工具调用出错
  • 结合蓝图而进行的分模块开发
    • 原来: 2(模块与入口)+4(html)个文件
    • 现在: 模块(4+4+4+4+4) + 5(html) + 1(入口)
      • 后来实际变成: 代码部分(12 directories, 57 files), html(6), 入口(1)
    • 6 -> 26
    • jinja -> ajax
  • spec先行, 架构师
  • gemini cli

AI绘画

  • nunchaku FLUX krea
    • 第一次50s, 第二次18s
    • 512x512: 第一次34s, 第二次3s
  • gguf q4
    • 第一次2min, 第二次1min
  • 使用即梦(豆包/字节家)
    • sessionid: ████████████████████████████████
    • 这将作为 Authorization 的 Bearer Token 值:Authorization: Bearer sessionid
    • jimeng.314xxx 伺服, 8000
    • "少女祈祷中..."这种提示词都无法过审
      • "The girl is praying..."是可行的
    • https://jimeng.jianying.com/ai-tool/generate
  • qwenimage部署

AI翻译

  • 模型:
    • alibayram/Qwen3-30B-A3B-Instruct-2507:latest
    • crosery/sakura-14b-qwen2.5-v1.0-q6k:latest
  • 工具:
    • 视频OCR翻译: 搜"视频 ocr srt提取"找到的: github视频硬字幕提取
      • 1, 快速ocr模式100it/s上下, 精确模式1.5it/s. 占据2到3GB内存
      • 精确模式难以忍受地慢/不可用. 快速模式一般速度, 16分钟视频用时7.5分钟
      • 2, 效果: 极佳, 完全可用(个人级别娱乐级别/非商业级别可用)
      • 3, 不可一次处理多个, 只能手动挨个处理
    • ai translator(调用ollama/sakura)

智能体/工作流/ai框架

  • dify, n8n, coze都是负向关键词, "低代码"排除
  • autogpt, langchain
  • 关于youtube盈利转化: 100w播放 -> 1w人民币
  • pocketflow: 只需要100行代码就能构建LLM框架

pocketflow

  • node
    • flow
    • shared store
  • llm设计模式
    • 聊天
    • 智能体: 思考/决策/工具调用
    • 工作流: 任务分解/分阶段顺序执行
    • rag: 检索向量数据库
    • "并行": 例如翻译任务
    • 人工审核介入
  • DSL, >>-运算符重载
  • 100行代码源码