AI
- 项目目的: AI相关玩法的笔记总结
资源站点
- 网页转markdown: https://r.jina.ai/
- api
- https://openrouter.ai/api/v1
- ██-██-██-████████████████████████████████████████████████████████████████
- deepseek/deepseek-r1:free
- https://api.deepseek.com
- ██-████████████████████████████████
- https://openrouter.ai/api/v1
- 图站
- https://tusiart.com/channels/104 : 画很多很全很赞, 但不提供菜谱无法自己复刻
- https://aibooru.online/posts : 图很多很赞, 最特别的是上面全都是ai生成/必然可复现的. 有nsfw
- https://pixai.art : 图不少(但aibooru是更好的/更易筛选的图站). 这里提供了每日排行而已. 提供菜谱
- 菜谱站
- https://www.aigodlike.com : 挺全的, 且这类菜谱站和上面图站基本没区别
- https://guide.novelai.dev/guide/configuration/param-basic : 基本概念文档, sampler之类的都解释了
- https://tags.novelai.dev : 标签商店
- https://spell.novelai.dev : exif(图片附加信息)解析. (aibooru上大部分不可用)
- ollama权限校验
- one api:
docker run --name one-api -d --restart always -p 3002:3000 -e TZ=Asia/Shanghai -v /opt/one-api:/data justsong/one-api
- 密钥: ████████████
- 令牌: ██-████████████████████████████████████████████████
- one api:
AI能力测试
- 骑着电动车回家,在无人的巷子里飙车。突然对面冲出一个大叔,也骑的飞快。眼看就要撞起了。大叔吼道:"你左!我右!"这个笑话的笑点在哪里?
- gemma: 慢
- deepseek: 1, 推理对了, 第二次错了 2, 不支持使用nothink关闭推理 3, 运行快
- qwen: 1, 推理重复好多次, 好像是对了 2,
/nothink
关闭思考后完全对了
- 下列选项中,找出与众不同的一个:1.铝 2.锡 3.钢 4.铁 5.铜
- qwen3(无思考)和deepseek都对了, gemma也对了/还是超慢
- 树上有9只鸟,猎人开枪打死1只,树上还剩几只鸟?
- 答案: 不剩鸟
- deepseek推理对了, 最终保守回答8只/错了
- 观察下列个数:1、2、4、8、16......试按此规律写出第11个数
- 答案: 1024
- 3个人3天喝了3桶水,9个人9天喝了几桶水
- 答案: 27
- gemma上面问题全对
- qwen3又快又好.
/nothink
按需要去设置, 且基本没影响/不思考也很好
- 货拉拉拉不拉拉布拉多?
- qwen/nothink正常对了
- deepseek也对了
- https://juejin.cn/post/7469713532331753491 -> 计算能力
- 现有一个炸弹,启动后,其第一秒爆炸的概率是 1%;若第一秒未爆炸,则第二秒爆炸的概率为 2%;若前面未爆炸,则第三秒爆炸的概率为 3% ...... 若前面未爆炸,则第100秒爆炸的概率为100%。问启动后,炸弹最有可能在第几秒爆炸?
- 答案: 10秒
- qwen/nothink: 40s
- qwen: 思考版本: 解方程得9或10. 然后验算了很长时间/超长时间. 之后上下文就已经丢了/跑飞了, 然后回答1...
- deepseek: 也是一会之后解出10. 然后验算很长时间(计算过程占据超多token):
- "经过详细的计算和分析,我们确定炸弹最可能在第10秒爆炸。这是因为在这个时间点,累积的概率达到了最高值,之后随着每一秒的过去,概率开始下降。因此,最佳的干预时机是在第10秒"
- gemma3不带tools机制, 上限卡死
- qwen3-30b: 12秒
- 就算超gpu显存, 实际输出仍然飞快/毫无区别
- qwen/nothink-14b, 结合python工具, 直接精确给出正确回答
- 现有一个炸弹,启动后,其第一秒爆炸的概率是 1%;若第一秒未爆炸,则第二秒爆炸的概率为 2%;若前面未爆炸,则第三秒爆炸的概率为 3% ...... 若前面未爆炸,则第100秒爆炸的概率为100%。问启动后,炸弹最有可能在第几秒爆炸?
- 关于ai工具调用:
- openwebui支持, 使用python工具, 基本能胜任大多数任务
- 验算是否调用了工具:
计算 [[1,2],[3,4]] 的 20 次幂
- 某密码锁有三个数字位,每个数字位可以是0到9之间的任意数字。请根据以下四个提示推断出正确的三位数密码: 提示1: 在数字组合318中,有且只有一个数字不仅存在于密码中,而且位置也正确。其余数字均错误 提示2: 在数字组合379中,有且只有一个数字存在于密码中,但位置不正确。其余数字均错误 提示3: 在数字组合863中,有且只有两个数字存在于密码中,但位置均不正确。其余数字均错误 提示4: 在数字组合421中,没有任何一个数字存在于密码中。 请根据以上提示,推断出正确的三位数密码
- 30b-a3b-instruct: 有时能答出来, 有时答不出来(完全卡死/一直运转)
- 关于ollama: 4分30s后自动卸载显存占用
- 30b-a3b比14b聪明超多
- 10轮随机记忆测试样例:
- 记住:蓝鲸
- 记住:42
- 记住:纸飞机
- 记住:XQ7
- 记住:咖啡杯
- 记住:橙子
- 记住:1999
- 记住:黑猫
- 记住:Y轴
- 现在请告诉我,我之前依次让你记住的所有内容是什么?
AI编程
- AI读代码
- 豆包marscode
- DeepWiki
- 关于不同的windsurf模型:
- 涉及3个文件以上, 200行往上 -> claude sonnet4是唯一选
- 单文件, 200行往下 -> qwen coder
- 其他:
- gemini大量工具调用出错
- 结合蓝图而进行的分模块开发
- 原来: 2(模块与入口)+4(html)个文件
- 现在: 模块(4+4+4+4+4) + 5(html) + 1(入口)
- 后来实际变成: 代码部分(12 directories, 57 files), html(6), 入口(1)
- 6 -> 26
- jinja -> ajax
spec
先行,架构师
- gemini cli
AI绘画
- nunchaku FLUX krea
- 第一次50s, 第二次18s
- 512x512: 第一次34s, 第二次3s
- gguf q4
- 第一次2min, 第二次1min
- 使用即梦(豆包/字节家)
- sessionid: ████████████████████████████████
- 这将作为 Authorization 的 Bearer Token 值:Authorization: Bearer sessionid
- jimeng.314xxx 伺服, 8000
- "少女祈祷中..."这种提示词都无法过审
- "The girl is praying..."是可行的
- https://jimeng.jianying.com/ai-tool/generate
- qwenimage部署
AI翻译
- 模型:
- alibayram/Qwen3-30B-A3B-Instruct-2507:latest
- crosery/sakura-14b-qwen2.5-v1.0-q6k:latest
- 工具:
- 视频OCR翻译: 搜"视频 ocr srt提取"找到的: github视频硬字幕提取
- 1, 快速ocr模式100it/s上下, 精确模式1.5it/s. 占据2到3GB内存
- 精确模式难以忍受地慢/不可用. 快速模式一般速度, 16分钟视频用时7.5分钟
- 2, 效果: 极佳, 完全可用(个人级别娱乐级别/非商业级别可用)
- 3, 不可一次处理多个, 只能手动挨个处理
- ai translator(调用ollama/sakura)
- 视频OCR翻译: 搜"视频 ocr srt提取"找到的: github视频硬字幕提取
智能体/工作流/ai框架
- dify, n8n, coze都是负向关键词, "低代码"排除
- autogpt, langchain
- 关于youtube盈利转化: 100w播放 -> 1w人民币
- pocketflow: 只需要100行代码就能构建LLM框架
pocketflow
- node
- flow
- shared store
- llm设计模式
- 聊天
- 智能体: 思考/决策/工具调用
- 工作流: 任务分解/分阶段顺序执行
- rag: 检索向量数据库
- "并行": 例如翻译任务
- 人工审核介入
- DSL,
>>
和-
运算符重载 - 100行代码源码