AI

发表于 2025-04-19 分类于工具评论数：

项目目的: AI相关玩法的笔记总结

资源站点

网页转markdown: https://r.jina.ai/
api
- https://openrouter.ai/api/v1
  - ██-██-██-████████████████████████████████████████████████████████████████
  - deepseek/deepseek-r1:free
- https://api.deepseek.com
  - ██-████████████████████████████████
图站
- https://tusiart.com/channels/104 : 画很多很全很赞, 但不提供菜谱无法自己复刻
- https://aibooru.online/posts : 图很多很赞, 最特别的是上面全都是ai生成/必然可复现的. 有nsfw
- https://pixai.art : 图不少(但aibooru是更好的/更易筛选的图站). 这里提供了每日排行而已. 提供菜谱
菜谱站
- https://www.aigodlike.com : 挺全的, 且这类菜谱站和上面图站基本没区别
- https://guide.novelai.dev/guide/configuration/param-basic : 基本概念文档, sampler之类的都解释了
- https://tags.novelai.dev : 标签商店
- https://spell.novelai.dev : exif(图片附加信息)解析. (aibooru上大部分不可用)
ollama权限校验
- one api:
  - docker run --name one-api -d --restart always -p 3002:3000 -e TZ=Asia/Shanghai -v /opt/one-api:/data justsong/one-api
  - 密钥: ████████████
  - 令牌: ██-████████████████████████████████████████████████

AI能力测试

骑着电动车回家，在无人的巷子里飙车。突然对面冲出一个大叔，也骑的飞快。眼看就要撞起了。大叔吼道："你左！我右！"这个笑话的笑点在哪里？
- gemma: 慢
- deepseek: 1, 推理对了, 第二次错了 2, 不支持使用nothink关闭推理 3, 运行快
- qwen: 1, 推理重复好多次, 好像是对了 2, /nothink关闭思考后完全对了
下列选项中，找出与众不同的一个：1.铝 2.锡 3.钢 4.铁 5.铜
- qwen3(无思考)和deepseek都对了, gemma也对了/还是超慢
树上有9只鸟，猎人开枪打死1只，树上还剩几只鸟？
- 答案: 不剩鸟
- deepseek推理对了, 最终保守回答8只/错了
观察下列个数：1、2、4、8、16......试按此规律写出第11个数
- 答案: 1024
3个人3天喝了3桶水，9个人9天喝了几桶水
- 答案: 27
- gemma上面问题全对
- qwen3又快又好. /nothink按需要去设置, 且基本没影响/不思考也很好
货拉拉拉不拉拉布拉多？
- qwen/nothink正常对了
- deepseek也对了
https://juejin.cn/post/7469713532331753491 -> 计算能力
- 现有一个炸弹，启动后，其第一秒爆炸的概率是 1%；若第一秒未爆炸，则第二秒爆炸的概率为 2%；若前面未爆炸，则第三秒爆炸的概率为 3% ...... 若前面未爆炸，则第100秒爆炸的概率为100%。问启动后，炸弹最有可能在第几秒爆炸？
  - 答案: 10秒
  - qwen/nothink: 40s
  - qwen: 思考版本: 解方程得9或10. 然后验算了很长时间/超长时间. 之后上下文就已经丢了/跑飞了, 然后回答1...
  - deepseek: 也是一会之后解出10. 然后验算很长时间(计算过程占据超多token):
    - "经过详细的计算和分析，我们确定炸弹最可能在第10秒爆炸。这是因为在这个时间点，累积的概率达到了最高值，之后随着每一秒的过去，概率开始下降。因此，最佳的干预时机是在第10秒"
  - gemma3不带tools机制, 上限卡死
  - qwen3-30b: 12秒
    - 就算超gpu显存, 实际输出仍然飞快/毫无区别
  - qwen/nothink-14b, 结合python工具, 直接精确给出正确回答
关于ai工具调用:
- openwebui支持, 使用python工具, 基本能胜任大多数任务
- 验算是否调用了工具:
  - 计算 [[1,2],[3,4]] 的 20 次幂
某密码锁有三个数字位，每个数字位可以是0到9之间的任意数字。请根据以下四个提示推断出正确的三位数密码：提示1: 在数字组合318中，有且只有一个数字不仅存在于密码中，而且位置也正确。其余数字均错误提示2: 在数字组合379中，有且只有一个数字存在于密码中，但位置不正确。其余数字均错误提示3: 在数字组合863中，有且只有两个数字存在于密码中，但位置均不正确。其余数字均错误提示4: 在数字组合421中，没有任何一个数字存在于密码中。请根据以上提示，推断出正确的三位数密码
- 30b-a3b-instruct: 有时能答出来, 有时答不出来(完全卡死/一直运转)
关于ollama: 4分30s后自动卸载显存占用
30b-a3b比14b聪明超多
10轮随机记忆测试样例:
- 记住：蓝鲸
- 记住：42
- 记住：纸飞机
- 记住：XQ7
- 记住：咖啡杯
- 记住：橙子
- 记住：1999
- 记住：黑猫
- 记住：Y轴
- 现在请告诉我，我之前依次让你记住的所有内容是什么？

AI编程

AI读代码
- 豆包marscode
- DeepWiki
关于不同的windsurf模型:
- 涉及3个文件以上, 200行往上 -> claude sonnet4是唯一选
- 单文件, 200行往下 -> qwen coder
- 其他:
  - gemini大量工具调用出错
结合蓝图而进行的分模块开发
- 原来: 2(模块与入口)+4(html)个文件
- 现在: 模块(4+4+4+4+4) + 5(html) + 1(入口)
  - 后来实际变成: 代码部分(12 directories, 57 files), html(6), 入口(1)
- 6 -> 26
- jinja -> ajax
spec先行, 架构师
gemini cli

让AI理解并使用大型第三方库

AI绘画

nunchaku FLUX krea
- 第一次50s, 第二次18s
- 512x512: 第一次34s, 第二次3s
gguf q4
- 第一次2min, 第二次1min
使用即梦(豆包/字节家)
- sessionid: ████████████████████████████████
- 这将作为 Authorization 的 Bearer Token 值：Authorization: Bearer sessionid
- jimeng.314xxx 伺服, 8000
- "少女祈祷中..."这种提示词都无法过审
  - "The girl is praying..."是可行的
- https://jimeng.jianying.com/ai-tool/generate
qwenimage部署

AI翻译

模型:
- alibayram/Qwen3-30B-A3B-Instruct-2507:latest
- crosery/sakura-14b-qwen2.5-v1.0-q6k:latest
工具:
- 视频OCR翻译: 搜"视频 ocr srt提取"找到的: github视频硬字幕提取
  - 1, 快速ocr模式100it/s上下, 精确模式1.5it/s. 占据2到3GB内存
  - 精确模式难以忍受地慢/不可用. 快速模式一般速度, 16分钟视频用时7.5分钟
  - 2, 效果: 极佳, 完全可用(个人级别娱乐级别/非商业级别可用)
  - 3, 不可一次处理多个, 只能手动挨个处理
- ai translator(调用ollama/sakura)

智能体/工作流/ai框架

dify, n8n, coze都是负向关键词, "低代码"排除
autogpt, langchain
关于youtube盈利转化: 100w播放 -> 1w人民币
pocketflow: 只需要100行代码就能构建LLM框架

pocketflow

node
- flow
- shared store
llm设计模式
- 聊天
- 智能体: 思考/决策/工具调用
- 工作流: 任务分解/分阶段顺序执行
- rag: 检索向量数据库
- "并行": 例如翻译任务
- 人工审核介入
DSL, >>和-运算符重载
100行代码源码
- youtube教程 by作者
- 中文readme