JSON トレンド
0post
2025.11.24〜(48週)
:0% :0% (30代/男性)
人気のポスト ※表示されているRP数は特定時点のものです
这里是过去一周,聚焦“Nano Banana Pro”生成真实照片、头像及基于自身头像延伸照片类型帖子中,点赞最高的20条。
我筛选了那些强调真实感、人物一致性、肖像修复/生成/扩展的实用分享,按点赞从高到低排序。每条直接附账号+链接,手机点就能看原帖和图片~
1. 4435赞
@PavolRusnak
https://t.co/oUhcFqjDHb
(自拍变专业西装头像提示,保持面部结构+工作室光影)
2. 6301赞
@NanoBanana
https://t.co/XY4rBGwF69
(修复老损照片并4K upscale,忠实现代摄影质量)
3. 2466赞
@michaelrabone
https://t.co/0DU4E7Qm6d
(老照片重现现代高清肖像,99%面部相似+自然皮肤纹理)
4. 2151赞
@KusoPhoto
https://t.co/2ZmZe6e8vk
(经纬度指定旅游照片集,人物融入真实环境+低画质变真实)
5. 2048赞
@KusoPhoto
https://t.co/XJ92Wx8w4e
(经纬度旅游生成人物照片,实时天气+天文氛围真实融合)
6. 2094赞
@satori_sz9
https://t.co/HOJy8ZKMhA
(上传图像转JSON提示,精确再现细节用于头像延伸)
7. 1690赞
@iX00AI
https://t.co/9QLaC6vJpk
(上传头像生成“区女子”照片图鉴,表情/服饰/小物真实分解)
8. 1683赞
@SSSS_CRYPTOMAN
https://t.co/Dj1rR8UQ0K
(虽是料理,但延伸到真实摄影加工,角度/光影优化头像式)
10. 1467赞
@nimentrix
https://t.co/tETX7UuOsL
(单张头像延伸前后图像,生成真实连贯人物页/电影帧)
11. 1219赞
@eijo_AIart
https://t.co/SMcUFyNwvg
(人物シート三面图+脸部特写,高解像真实皮肤/衣服质感)
12. 1122赞
@lucas_flatwhite
https://t.co/2hF6JWbaK5
(7大提示技巧,焦点人物/光影/角度控制真实头像生成)
13. 586赞
@blue_pen5805
https://t.co/X5lxYz5MWs
(手持照片式漫画封面,夸张但忠实原图真实主观视角)
14. 518赞
@HalimAlrasihi
https://t.co/6iFsOIvUPq
(风格参考强度控制,100%应用到头像延伸真实输出)
16. 387赞
@kajikent
https://t.co/etTrZTtB4R
(JSON结构化提示,精确控制高质真实图像/肖像生成)
17. 346赞
@starks_arq
https://t.co/2Y7W8QbPCt
(角度/人物/背景控制PDF,头像延伸示例+提示领)
19. 746赞
@madpencil_
https://t.co/JHndjILXYX
(添加搞笑元素到朋友头像,夸张姿势但保持真实基调) December 12, 2025
172RP
想象一下,一个软件团队在做一个大项目,但有个奇怪的规定:每个工程师只能工作几十分钟,最多几小时,干完就要换一个新的工程师。所以让这个团队完成简单项目任务还行,复杂一点需要长时间运行的项目,比如你让它克隆一个 claude .ai,它就做不到。
这其实就是 Coding Agent 的现状:没有记忆,上下文窗口长度有限。所以要它执行长时间任务,它还做不好。
Anthropic 的这篇博客:《Effective harnesses for long-running agents》,专门讨论了如何让 Agent 在跨越多个上下文窗口时依然能持续推进任务。
先看 Agent 在长任务中遇到的主要问题是什么?
主要三种:
第一种叫一口气干太多。比如你让 Agent 克隆一个 claude .ai 这样的网站,它会试图一次性搞定整个应用。结果上下文还没用完,功能写了一半,代码乱成一锅粥。下一个会话进来,面对半成品只能干瞪眼,花很多时间猜测前面到底做了什么。
第二种叫过早宣布胜利。项目做了一部分,后来的 Agent 看看环境,觉得好像差不多了,就直接收工。功能缺一大堆也不管。
第三种叫测试敷衍。Agent 改完代码,跑几个单元测试或者 curl 一下接口就觉得万事大吉,根本没有像真实用户那样端到端走一遍流程。
这三种失败模式的共同点是 Agent 不知道全局目标,也不知道该在哪里停下来、该留下什么给下一位。
那么 Anthropic 的解决方案是什么呢?
其实就是软件工程的一些现成的解决方案:引入类似人类团队的分工协作机制,将复杂任务拆解成小的可跟踪验证的任务,清晰的交接机制,并严格验证任务结果
一个初始化 Agent,它只在项目启动时出场一次,任务是搭好项目运行环境:有点像架构师的角色,写一个 init .sh 脚本方便后续启动开发服务器,建一个 claude-progress.txt 记录进度,做第一次 git 提交,最关键的是生成一份功能清单。
这份功能清单有多细?在克隆 claude .ai 的案例中,列了超过 200 条具体功能,比如用户能打开新对话、输入问题、按回车、看到 AI 回复。每一条初始状态都标记为失败,后续 Agent 必须逐条验证通过才能改成成功。
而且这里有个细节,这个清单不是用 Markdown 来写的,是一个 JSON 数组,因为 Anthropic 实验发现,相比 Markdown,模型在处理 JSON 时更不容易随意篡改或覆盖文件。
另一个是编码 Agent。在初始化项目后,后续就是它干活了,核心行为准则只有两条:一次只做一个功能,做完要留下干净的环境。
什么叫干净的环境?想象你往主分支提交代码的标准:没有严重 bug,代码整齐有文档,下一个人接手能直接开始新功能,不用先替你收拾烂摊子。
每次开工前,它先做几件事:
– 运行 pwd 看看自己在哪个目录
– 读 Git 日志和进度文件,搞清楚上一轮干了啥
– 看功能清单,挑一个最高优先级的未完成功能
– 跑一遍基础测试,确保 App 还能用
然后专心做一个功能,做完后:
– 写清楚的 Git commit message
– 更新 claude-progress.txt
– 只改功能清单里的状态字段,绝不删改需求本身
这个设计的巧妙之处在于,它把“记忆”外化成了文件和 Git 历史。每一轮的 Agent 不需要依赖上下文窗口里的碎片信息,而是模仿靠谱的人类工程师每天上班会做的事。先同步进度,确认环境正常,再动手干活。
测试环节的改进值得单独说。
原来 Agent 只会用代码层面的方式验证,比如跑单元测试或者调接口。问题是很多 bug 只有用户真正操作页面时才会暴露。
解决方案是给 Agent 配上浏览器自动化工具,比如 Puppeteer MCP。Agent 现在能像真人一样打开浏览器、点按钮、填表单、看页面渲染结果。Anthropic 放了一张动图,展示 Agent 测试克隆版 claude .ai 时自己截的图,确实是在像用户那样操作。
这招大幅提升了功能验证的准确率。当然也有边界,比如浏览器原生的 alert 弹窗,Puppeteer 捕捉不到,依赖弹窗的功能就容易出 bug。
这套方案还留了一些开放问题。
比如,到底是一个通用 Agent 全包好,还是搞专业分工?让测试 Agent 专门测,代码清理 Agent 专门收拾,也许效果更好。
再比如,这套经验是针对全栈 Web 开发优化的,能不能迁移到科研或金融建模这类长周期任务?应该可以,但需要实验验证。
响马 @xicilion 说:
> ai 的尽头依旧是软件工程。
AI Agent 也不是魔法,它一样需要从人类软件工程中汲取经验,它也需要将复杂的任务进行分解成简单的任务,要有一个结构化的工作环境和清晰的交接机制。
人类工程师为什么能跨团队、跨时区协作?因为有 Git、有文档、有 Code Review、有测试。AI Agent 要想长时间自主工作,也得把这些东西搬过来。
Anthropic 的方案,不过是把软件工程的最佳实践变成了 Agent 能理解的提示词和工具链。不是让模型变得更聪明,而是给它提供更好的脚手架。
Anthropic 的思路值得借鉴。无论你用的是 Claude、GPT 还是别的模型,在设计多轮长任务时,都要想清楚,怎么让下一轮的 Agent 快速进入状态,怎么避免它重复造轮子或者把代码搞成一团乱麻。即使是单轮任务,也要清楚它是没有记忆的,你需要通过外部文件来帮助它“想起来”之前做过的事。
以现在模型的能力,Coding Agent 已经能做很多事情了,核心还是在于你是不是能像软件工程中那样,去分解好任务,设计好工作的流程。
原文:Effective harnesses for long-running agents https://t.co/tERUGrV9wC
翻译:https://t.co/MByV8iiEoZ December 12, 2025
93RP
这里是最近三天“Nano Banana Pro”相关帖子中,点赞最高的20条
1. 6300赞
@NanoBanana
https://t.co/XY4rBGxcVH
(忠实修复老照片并上4K的超强提示)
2. 5107赞
@SSSS_CRYPTOMAN
https://t.co/0htPdDgA09
(一次性相机风日常快照提示集⑧)
3. 4168赞
@gizakdag
https://t.co/QdAsX1eHN2
(一键生成9张一致美学的Instagram产品feed)
4. 4433赞
@PavolRusnak
https://t.co/oUhcFqkbwJ
(用自拍生成专业西装头像)
5. 2042赞
@KusoPhoto
https://t.co/XJ92Wx93TM
(输入经纬度直接“旅游”镰仓)
6. 1699赞
@Ror_Fly
https://t.co/IizzYZCsz0
(Nano Banana Pro + Veo 3.1 做汽车改装关键帧视频)
7. 1681赞
@SSSS_CRYPTOMAN
https://t.co/Dj1rR8VnQi
(把外行料理照秒变美食杂志大片)
8. 1645赞
@NanoBanana
https://t.co/14QIjJBREU
(官方教你怎么用家具把空房间填满)
9. 1532赞
@VibeMarketer_
https://t.co/BgLLR2TH4V
(把竞品广告直接换成你家产品)
10. 1465赞
@nimentrix
https://t.co/tETX7Uvmij
(一张图变整页漫画教程)
11. 1394赞
@Ror_Fly
https://t.co/bpfrFckvIz
(汽车改装平滑过渡版)
12. 1204赞
@ZaraIrahh
https://t.co/sBMzqdkqL8
(雪天女孩+小狗超治愈肖像JSON提示)
13. 1190赞
@VibeMarketer_
https://t.co/D2LwulG4rJ
(同一个人多角度生活照)
14. 808赞
@bozhou_ai
https://t.co/c72XRErVp4
(AI分享会现场图)
15. 582赞
@blue_pen5805
https://t.co/X5lxYz6kM0
(手持日漫单行本的“书籍化”封面)
16. 346赞
@starks_arq
https://t.co/2Y7W8Qcns1
(角度/人物/背景控制PDF,回复NANO可领)
17. 260赞
@Just_sharon7
https://t.co/LDo5UclnKg
(oversize T恤女孩沙发写真JSON)
18. 214赞
@IamEmily2050
https://t.co/FafqQgK2cy
(海贼王女帝黑板画)
19. 198赞
@techhalla
https://t.co/WGcQQGvbpd
(两句提示直接出电影分镜网格)
20. 166赞
@MuchoAi
https://t.co/LqTWTpDBYD
(免费送爆卖缩略图GPTs,限时) December 12, 2025
81RP
Anthropic官方刚刚给出了一个最新解决方案:【让AI智能体持续有效的完成一个需要长时间、跨越多轮会话的复杂项目】
其给出了一套两步走的工程流程,让AI像人类程序员一样轮班写代码,每轮只做一个小功能,写完测试好,提交代码,写日志
每轮都清楚自己该干啥,且不把烂摊子留给下一轮,解决上下文窗口限制、或者多轮对话会话间的记忆缺失,导致的项目烂尾问题
1、首先,搞一个初始化智能体 Initializer Agent
类似项目启动时的架构师或项目经理,负责搭好架子
创建功能列表,根据用户的高级需求拆解出一个详细具体的JSON功能列表,每个功能最初都标记为“未通过”,类似待办事项清单,明确告诉智能体要完成什么
设置初始环境,编写一个https://t.co/S5Nm3OzTc8脚本(用于启动开发服务器等)、一个claude-progress.txt文件(记录智能体的操作日志)和一个初始的Git提交(记录项目起点)
2、编程代理 Coding Agent
之后每轮对话都派它上场,固定SOP
先pwd、读日志、读功能清单、git log、启动服务、跑一遍端到端冒烟测试,确认前任没留坑
只挑一条最高优先级的“未通过”功能,增量开发,无需一口气写完整个程序
改完用Puppeteer做真人级浏览器测试,真正把功能跑通才把清单项标“通过”
提交git(写清楚 commit message)并更新progress文件,给下一位留干净分支
用JSON非Markdown存功能清单,防止模型手滑乱改;每轮只动一个功能保持主分支随时可发布,避免一次性写太多代码导致上下文爆炸、半途而废或留下烂摊子
#ClaudeAgentSDK #编程agent December 12, 2025
42RP
海外で鬼バズり中の完全再現プロンプトが最高!!
あ〜この生成AIの画像真似したい
みたいなのありません??
画像なしでプロンプトのみで
再現する方法があるらしい
凄すぎる!!
海外では無限AIインフルエンサーを
誰でも作れるくない?
となっているそうな
原文のプロンプト
「extract all visual details from this image and convert them into a clean, well-structured JSON prompt. include sections: "subject", "clothing", "hair", "face",
"accessories", "environment", "lighting", "camera",
"style"...」
ただ引用だけだと
芸がないので作成した
てる式完全再現プロンプトは
⇩に貼っておきます!! December 12, 2025
35RP
✨ JSONリライト変換法
Before → After の手順🍌✨
元画像を変えずに “情報だけ” を読み取るための抽出プロンプトです。
※これは抽出専用のプロンプトのため、元画像の雰囲気を変えずにそのまま読み取れるよう、倭国人女性として扱う指定を加えています。
Extract all visual details from this image and convert them into a clean, well-structured JSON prompt.
Include the sections: “subject”, “clothing”, “hair”, “face”, “accessories”, “environment”, “lighting”, “camera”, “style”.
Add the output information: “aspect_ratio”: “9:16”, “orientation”: “vertical”.
Do not invent or assume anything that is not clearly visible in the image.
In the “subject” field, always include: “a Japanese woman”.
出力された JSON を nano banana pro で生成します🍌✨ December 12, 2025
29RP
なんか 腹立たしいけど買って確認しました。
Jsonファイルに一箇所だけスペースが消されてるけど
それ以外のシェイプキーとかの数値全く一緒なんですけど???????????????????????????????????????????????
←私の 人の商品勝手にまとめてる人の→ https://t.co/oYeoYlmVFm December 12, 2025
26RP
公式からNano Banana Proのtipsが公開されていたので、そのなかに含まれるすべての要素をjsonの項目にしてフォーマット化しました。以下に置いておきますのでよかったら使ってみてください😊
Nano Banana Proの7つのtips
https://t.co/KhnmeuP0V0
{
"nano_banana_pro_request": {
"mode": "generate",
"meta": {
"project_name": "Pop_Art_Cosplay_Portrait",
"description": "A configuration to recreate the vibrant, pop-art styled portrait of a cosplayer in a geometric studio setting, based on image analysis."
},
"vision_parameters": {
"prompt_components": {
"subject": "The woman has super long, almost white platinum blonde hair. Her bangs are blunt and straight above her eyes, while the sides are cut in a princess style that frames her face. From above her left ear to the back of her head, she has several thin braids (cornrow-style), accented with pink extensions braided into them. Her hair is gently wavy overall, with a soft, silky texture. A young woman wearing a colorful geometric patterned cutout leotard (neon yellow, orange, blue, pink) with buckle straps, a multi-colored choker, layered necklaces. Her flawless, porcelain skin has a soft glow. Her eyes, enhanced by striking blue contact lenses, feature a gradient of coral and pink eyeshadow on the lids and lower lash line, defined by sharp black winged eyeliner and long, curled lashes. Small, iridescent rhinestone stickers are delicately arranged below her left eye. Her eyebrows are light brown and gently arched. A soft pink blush flushes her cheeks. Her lips are painted with a coral-pink gradient tint and a subtle gloss finish.",
"action": "Posing with one hand pointing to her cheek and the other hand pointing directly at the camera, smiling confidently.",
"location": "A brightly lit studio set with large, pastel-colored geometric shapes (pink, blue, yellow triangles and blocks) in a pop-art style.",
"composition": "Vertical portrait, medium shot, capturing the subject from mid-thigh up.",
"style": "Photograph, high-res, vibrant, high-saturation, pop art aesthetic, candy colors, clean studio look.",
"negative_prompt": "blur, low quality, distortion, dark, moody, realistic landscape, monochrome"
},
"factual_constraints": {
"require_accuracy": false,
"domain": "photography",
"context": "Pop art, cosplay fashion photography"
}
},
"technical_controls": {
"camera_settings": {
"angle": "Eye-level shot",
"depth_of_field": "Shallow (subject in sharp focus, geometric background slightly blurred)",
"lighting": "Bright, soft studio lighting, even illumination",
"color_grading": "Vibrant, high saturation, candy color palette, pop art tones"
},
"output_format": {
"aspect_ratio": "2:3",
"resolution": "4K",
"file_type": "png"
}
},
"text_capabilities": {
"render_text": {
"enabled": false,
"content": "",
"font_style": "",
"position": ""
},
"translation": {
"enabled": false,
"target_language": "",
"source_context": ""
}
},
"reference_inputs": {
"input_limit_check": "max_14_images",
"images": [
{
"id": "img_source_001",
"url": "path/to/image_0.png",
"role": "structure_pose",
"weight": 1.0
},
{
"id": "img_source_002",
"url": "path/to/image_0.png",
"role": "style_transfer",
"weight": 1.0
},
{
"id": "img_source_003",
"url": "path/to/image_0.png",
"role": "character_reference",
"consistency_mode": "strict"
}
]
},
"studio_edits": {
"enabled": false,
"edit_instruction": "",
"masking_focus": "",
"lighting_adjustment": "",
"focus_adjustment": ""
},
"branding_and_mockups": {
"enabled": false,
"brand_assets": {
"logo_url": "",
"pattern_url": ""
},
"application_surface": "",
"preserve_texture": false
}
}
}
-----
on November 21st Higgsfield granted FREE access to Google's Nano Banana Pro Image model.
Higgsfield AI(@higgsfield_ai)
Nano Banana Pro is unlimited for a year for everyone joining @higgsfield_ai in the next 2 days. December 12, 2025
25RP
アクションメカ娘
⠀
ズシャァッ
__________
⠀
イーロンさんのGrok Imagineに関するポストを見て
⠀
「へー、自然言語とYAMLの両方使えるんだ!」
⠀
と思ったので、倭国語だと英訳時にニュアンスが変わるし、だったら最初から英語で書くならYAMLの方がいいじゃん!ということで、今夜の寄せるメカ娘はYAMLで書いてみたら、英語の自然言語より意図が伝わりやすい気がしました。
⠀
で、このポストを書くために改めてイーロンさんのポストを確認したら「YAML」じゃあなくて「JSON」だったので、やっぱり伝わりやすいと思ったのは気のせいでした。
⠀
結局、何でもいいんだ。
Grok Imagine賢い。
⠀
ところでイーロンさんのいう「今週末」というのはいつまでですか?発言時点での「今週末」は現在からみると「先週末」だったんですが…。
⠀
他の動画生成プラットフォームのアップデートには興味がないけど、Grok Imagineは待ち遠しいです。 December 12, 2025
23RP
【Origin Prompt Pulse AI】③
構造化・YAML
ー構造化
これを構造化と名乗るのかねね自身も最近聞きはじめた言葉だけど要は「キャラ」「服」「背景」みたいにセクション分けして書いていくやり方ね。
character:ピンクのロング髪、グリーンの目
outfit:カッターシャツ、ミニスカート
みたいな感じね。
特に書き方に細かいルールはない、LLMの認識力がそこそこ高ければこの書き方が認識してくれやすいと思う。
ーYAML
上記の構造化をコンピュータが認識しやすいようにさらに細分化した感じ。
こんなん人間には書けないと思うから先に作ったプロンプトをGPTとかでYAML化してあるいはJSON化してってお願いする感じ。
個人的には苦手というかコレ認識できるツールが限られてるから覚えておくだけでいいと思うわ
Nano-BananaやSora2では結構有効。この二つを出した時点で旧式の画像生成には向かないよね。
単語・文章・構造化
ここまでは色んなプロンプトの書き方の紹介みたいな感じ、何がいいという正解はないし。そもそもツールによって変えてあげないとね。
結局私も超文章でいく過程で単語で調整して、そもそも文章だから勝手に構造化(セクション分け)していく。
出力した結果との乖離をみながら微調整かけていくのね⭐
次は【倭国語or英語】になるかな~ December 12, 2025
17RP
Nano Banana Proめちゃくちゃ凄いですよね。
そんなNano Banana Proの性能を最大限に引き出して、高クオリティで狙ったイメージ通りの画像を生成するためにjson形式の構造化プロンプトが非常に有効です。
そんな構造化プロンプトの解説 / なぜこれから「Vibe Design」の時代になるのか?/ json形式の構造化プロンプトを簡単に生成できるGem/GPTs配布 / Nano Banana Proのオススメ用途 など内容盛りだくさんのnoteを書きました!
週末Nano Banana Pro触ってみたけど思うように使いこなせていないという方にも、これからガッツリ触っていこうという方にもかなり参考になる内容だと思うのでぜひご一読下さい!
https://t.co/1NKCfUD25I December 12, 2025
16RP
【Anthropicによる長時間稼働エージェントのハーネス設計】
Anthropicが、長時間稼働するAIエージェントが複数のコンテキストウィンドウをまたいで一貫して進捗するためのハーネス設計を公開した。Opus4.5とClaude Agent SDKを使い、claude. aiクローンのフルスタックWebアプリを題材とした検証である。
エージェントは、セッションごとにコンテキストがリセットされるため、途中の状態が十分に共有されないと「一度にアプリ全体を実装しようとしてコンテキストが尽きる」「機能が揃っているように見える時点で早く完了を宣言する」「ユニットテストやcurlだけで済ませてエンドツーエンドの不具合を見逃す」「そもそもアプリの起動方法を思い出すのに時間を使う」といった問題が起こる。
そこで記事では、最初のセッションでinitializer agentがhttps://t.co/dxl8KJ6elM、作業ログのclaude-progress.txt、機能要件をJSONで列挙したfeature_list.json、初期gitコミットを用意し、以降のcoding agentは毎回これらを読み込んで環境を立ち上げ、一度に1機能だけを実装し、テスト後にgitコミットと進捗サマリを残すという二段構成を提案している。機能ごとに「passes」フラグだけを更新する運用とし、テスト定義の削除や書き換えは認めないことで、長期タスクでも全体の完了条件を見失わない設計となっている。
Webアプリの検証では、Puppeteer MCPサーバーなどのブラウザ自動化ツールを組み合わせ、人間ユーザーと同じ手順で画面操作しながらE2Eテストを行うことで、コードだけからは気づきにくいバグも検出できたという。一方で、ブラウザネイティブのアラートモーダルが見えないなど、視覚やツール側の制約による残課題も指摘されている。今後は、テスト専用やQA専用のエージェントなどマルチエージェント構成や、フルスタックWeb以外の分野への一般化が検討課題として挙げられている。 December 12, 2025
9RP
VRChat公式カメラをOSC操作でカメラアングルを8箇所登録できるギミックを販売開始しました
登録したカメラアングルはVR内のタッチパネルで1タッチで呼び出せます
また登録したアングルの情報はJSONで書き出せるのでいつでも再読み込み可能です
期間限定で800円で販売中
#おはようVtuber
#vket https://t.co/DifrNhevpo December 12, 2025
9RP
新的笑话ww
公司部署了基于 LLM 的 Code Review
然后,Suggestions:
「在 get_drives_history 函数中,建议增加对故障数据的时空弯曲分析支持,根据广义相对论,强大的引力场可能导致时空弯曲,建议集成时空曲率算法,分析引力对故障数据的影响」
「在 get_drives_history 函数中,建议增加对故障数据的平行宇宙分析支持。根据平行宇宙理论,每个硬盘故障在不同宇宙中有不同结果,建议集成平行宇宙算法,计算所有可能宇宙中的故障概率」
「在 get_drives_summary 函数中,建议增加对驱动器量子纠缠信息的集成。根据量子纠缠理论,存储设备之间可能存在纠缠关系,建议添加纠缠态字段,分析量子关联对故障传播的影响」
「在 config.json 配置文件中,建议增加时间旅行集成配置。根据时间旅行理论,未来的故障信息可能传递到现在,建议配置与时间机器交互的接口,实现基于未来信息的故障预测」
Thank you GLM 4.6 😇 December 12, 2025
7RP
【サプライチェーン攻撃拡大】Shai-Hulud 2.0と呼ばれる新たなnpmサプライチェーン攻撃が進行中で、25,000以上のGitHubリポジトリが侵害され、機密情報が流出している。Zapier、ENS Domains、PostHog、Postmanなどの主要プロジェクトからのパッケージがトロイの木馬化された。
Wizの調査によると、これらの侵害されたパッケージは非常に普及率が高く、Wizがスキャンしたクラウドおよびコード環境の約27%に存在している。攻撃は急速に拡大しており、30分ごとに約1,000の新しいリポジトリが作成されている。新たに侵害されたパッケージが引き続き発見されており、その多くがこの活動に直接関連するファイルを含んでいる。
2025年11月21日から23日の間にトロイの木馬化されたnpmパッケージがアップロードされたことが確認された。インストールされると、マルウェアは開発者およびCI/CDのシークレットを「Shai-Hulud」を参照する説明を持つGitHubリポジトリに流出させる。この亜種はpreinstallフェーズでのみ実行される。
マルウェアは以下のファイルを作成する:cloud.json、contents.json、environment.json、truffleSecrets.json。ペイロードは感染したマシンを「SHA1HULUD」という名前のセルフホステッドランナーとして登録する。その後、インジェクション脆弱性を含む.github/workflows/discussion.yamlというワークフローを追加し、セルフホステッドランナー上で特に実行される。これにより攻撃者は将来、GitHubリポジトリでディスカッションを開くことで感染したマシン上で任意のコマンドを実行できる。
特に危険なのはコンテナブレイクアウト機能である。マルウェアはdocker run --rm --privileged -v /:/host ubuntu bash -c "cp /host/tmp/runner /host/etc/sudoers.d/runner"を実行してroot権限の取得を試みる。これはホストのルートファイルシステムを特権コンテナにマウントし、悪意あるsudoersファイルをコピーすることで、侵害されたユーザーにパスワードなしのrootアクセスを効果的に付与する。
防御策として、依存関係を既知のクリーンバージョンに固定するか2025年11月21日以前のビルドにロールバックする、npmトークン・GitHub PAT・SSHキー・クラウドプロバイダー認証情報を取り消して再生成する、開発者およびCI/CDアカウントにフィッシング耐性のあるMFAを強制する、説明に「Shai-Hulud」を含む新しく作成されたリポジトリを検索することが推奨されている。
https://t.co/Z0zaIk4fFp December 12, 2025
6RP
台湾組織を中心に3年以上続く高度なサイバー諜報作戦が明らかになった。中国系とされるAPT24が巧妙な手口でBADAUDIOを配布し、広範な供給網を経由して大量感染を狙ったことが判明している。難読化技術を駆使した持続的侵入が特徴だ。
BADAUDIOはC++製の第一段階ダウンローダーで、システム情報収集、AES暗号化、Cookie経由の送信、暗号化ペイロードの取得とメモリ上実行を行う。復号されたペイロードにはAPT24と関連付けられたCobalt Strike Beaconが含まれる例が確認され、制御フロー難読化により解析を大きく妨害する構造になっている。DLLサーチオーダー ハイジャックに加え、VBSやBAT、LNKを連結した多段実行で永続化を実現する。
感染経路は三段階で進化し、2022年末からの正規サイト改ざん、2024〜2025年の台湾マーケティング企業を介した大規模サプライチェーン攻撃、そして2025年の精密なスピアフィッシングへと広がった。特に2024年の供給網侵害では1000以上のドメインが影響を受け、難読化されたスクリプトがJSONに潜ませて配布された。さらに攻撃者はGoogle DriveやOneDriveを悪用し、暗号化アーカイブを正規サービス経由で配布していた。GTIGはAPT24が極めて適応的かつ継続的であり、今後も手法を発展させる可能性が高いと警告している。
https://t.co/ixRlfE503a December 12, 2025
5RP
投票に行く前にどんな内容なのか確認しましょう🤗✨AI解説
FIP-14: Add Support for FDC Web2 Attestations について解説します。
現在(2025年11月)、Flareネットワークで進行中の非常に重要な投票です。
一言で言うと、「Flareを『ただの仮想通貨のチェーン』から、『世界中のあらゆるリアルデータを使えるチェーン』に進化させるアップグレード」です。
詳しく解説します。
1. FIP-14の概要
* 提案内容: Flare Data Connector (FDC) という機能に、新しいデータタイプ「Web2Json」を追加する提案です。
* 何が変わる?
* これまで: Flareが読み込めるデータは主に「仮想通貨の価格(FTSO)」や「他のブロックチェーンの取引データ」が中心でした。
* FIP-14可決後: インターネット上(Web2)にあるあらゆる情報を、信頼できる形でブロックチェーンに取り込めるようになります。
2. 「Web2 Attestations」とは?
「Attestation(アテステーション)」は「証明」という意味です。
つまり、「GoogleやX(Twitter)、天気予報サイト、スポーツ結果サイトなどのデータを、Flareネットワークが『この情報は正しい』と証明して取り込む機能」のことです。
具体的には、以下のようなデータがFlare上で使えるようになります。
* スポーツの結果: 「昨日のサッカーの試合でAチームが勝ったか?」→ 予測市場(賭け)アプリで利用
* 天気情報: 「台風が上陸したか?」→ 保険プロトコルで自動支払い
* 金融データ: 「Appleの株価が200ドルを超えたか?」→ RWA(現実資産)トークンの運用
* SNSの投稿: 「有名人Xがこのハッシュタグで投稿したか?」→ デジタルIDの連携
3. 投資家にとってのメリット
この提案は、FLRの長期的価値を高めるための「インフラ強化」です。
* 実需の拡大:
FTSO(価格)だけでなく、FDC(汎用データ)が強化されることで、Flare上で作れるアプリ(DApps)の種類が爆発的に増えます。
アプリが増える = ガス代や担保として FLRの需要が増える
* 競合との差別化:
他のブロックチェーン(EthereumやSolanaなど)は、外部データを取り込むのに「Chainlink」などの外部サービスに頼る必要がありますが、Flareはこれを自前(ネイティブ)で、しかも分散的に行えます。 これがFlareの最強の武器になります。
4. 投票判断のポイント
基本的に、この提案はFlareのロードマップ(FDCの完成)に沿った技術的なアップデートであり、「賛成(For)」することでネットワークの機能が向上します。
* リスク: 複雑なデータを取り込むため、システムが多少複雑になりますが、検証プロセス(管理グループによる審査)もセットで導入されるため、安全性は考慮されています。
* 結論: Flareのエコシステム拡大(=FLR価格の長期的上昇)を望むなら、ポジティブな提案です。 December 12, 2025
5RP
先ほどアップデートしました
~更新内容~
VRM1.0読込対応
視線上下、左右反転機能追加
マイク入力によるリップシンク対応
(規約更新)
UIのセーブ用Jsonファイル保存読み込み機能追加 https://t.co/WGJQFDggMG December 12, 2025
5RP
使用 Gemini 3 从零构建智能体实用指南
来自 Phil Schmid 最新发布的实用教程,核心目标是“去神秘化”AI 智能体的构建过程。Schmid 强调:智能体本质上非常简单——就是一个 LLM 放在一个循环里,加上一些工具,让模型自己决定什么时候用工具、怎么规划任务。整个教程基于 Gemini 3 Pro,从最基础的文本生成,一步步进化到能读写文件、持续对话的完整 CLI 智能体。全程代码不到 100 行,非常适合想快速上手的人。
智能体的核心组成(Schmid 的“生命体”比喻)
· 大脑(Model):Gemini 3 Pro,负责思考、规划、决定是否调用工具。
· 手和眼睛(Tools):外部函数,例如读取文件、列出目录、写入文件等。
· 工作空间/记忆(Context):对话历史 + 工具执行结果,这就是所谓的“上下文工程”。
· 生命循环(Loop):观察 → 思考 → 行动 → 观察……直到任务完成或达到终止条件。
整个流程就是经典的 ReAct 模式(Reasoning + Acting),但用 Gemini 原生函数调用实现,不依赖 LangGraph、CrewAI 等复杂框架。
逐步构建过程
1. 最基础:纯文本生成(还不是智能体)
先创建一个 Agent 类,用 gemini-3-pro-preview 模型直接生成文本。相当于一个加强版聊天机器人。
2. 第二步:加入工具(Function Calling)
· 用 JSON Schema 定义工具(名称、描述、参数)。
· 实现对应的 Python 函数(比如 read_file、write_file、list_dir)。
· 把工具定义传给模型,模型如果需要就会返回结构化的工具调用请求。
3. 第三步:闭环(真正成为智能体)
· 在代码里检测模型是否要调用工具 → 执行工具 → 把结果以 functionResponse 形式塞回模型 → 模型继续思考。
· 关键技巧:Gemini 3 有特殊的“Thought Signatures”,必须原样保留,否则会丢失链式推理能力。
· 加上系统引导指令,比如让它像 Linus Torvalds 一样说话,增加个性。
4. 第四步:多轮 CLI 交互
用 while True 循环包装,让用户可以持续输入指令,智能体就能处理多步骤任务(比如先列目录 → 再读某个文件 → 再修改内容)。
最终效果:你可以在终端里对智能体说“帮我把 data.txt 里的内容改成“Hello World””,它会自动调用 `read_file` → 思考 → write_file,一步步完成。
最佳工程实践(文章干货最集中的部分)
1. 工具设计(Tools Design)
· 工具的名称和描述必须写得极度清晰、毫不含糊,让模型一眼就能明白这个工具到底是干什么的以及什么时候该用。
· 每个工具的参数要尽量精简,只保留真正必要的字段,避免参数过多导致模型困惑或生成错误调用。
· 工具执行后的返回结果一定要对人类友好:包含清晰的成功/失败状态、详细的错误信息、必要的上下文,甚至可以主动给出下一步建议。这样模型在下一轮推理时就能获得高质量输入。
2. 上下文管理(Context Management)
· 绝不要一次性把大量文件内容或数据直接塞进上下文(容易超窗口或让模型迷失重点)。
· 优先设计“按需加载”类的工具,例如 read_file、search_database 等,让模型自己决定什么时候需要拉取哪些具体信息。
· 当对话轮次变长、上下文快要爆炸时,要么用摘要压缩历史,要么引入外部记忆系统(向量数据库、键值存储等)。
3. 避免过度工程(Avoid Over-Engineering)
· 先用“单个强大模型 + 简单 while 循环 + 原生函数调用”把原型跑通,这是性价比最高的方式。
· 只有当任务确实需要复杂的状态机、多智能体协作、回滚机制时,再引入 LangGraph、CrewAI、Autogen 等重型框架。大多数实际场景下,简单循环已经完全够用。
4. 安全与健壮性(Safety & Robustness)
· 必须设置最大循环次数(max_iterations),防止模型陷入死循环。
· 任何涉及破坏性操作的工具(删除文件、发邮件、转账等)都要加入人工确认步骤或严格的白名单机制。
· 通过强有力的系统指令(System Instruction)建立 guardrails,明确告诉模型哪些事情绝对不允许做。
5. 调试与可观测性(Debugging)
· 在开发阶段,把每一次工具调用请求、工具执行结果、模型的思考过程全部打印出来。
· 这种极高的透明度能让你瞬间定位问题是出在工具定义、返回格式,还是模型推理逻辑上,是构建可靠智能体最快的调试方式。
这些建议高度凝练,几乎适用于所有基于 LLM 的智能体项目(不管你用 Gemini、Claude、GPT 还是开源模型),强烈建议把它们当作检查清单,在每次搭建新智能体时逐条对照。
文章的核心结论
· 构建一个实用的智能体**远没有想象中复杂**,核心就是“模型 + 工具 + 循环 + 良好上下文管理”。
· 只要工具设计得好、上下文控制得当,Gemini 3 Pro 这种原生支持多工具调用的模型,完全可以单体搞定大部分任务。
· Schmid 鼓励大家先从最简原型开始跑通,再逐步增加记忆、规划器、多智能体协作等高级特性。
博客地址
https://t.co/WKZLvbP1NG December 12, 2025
5RP
9STEPしかないからか破綻結構するけど
色々プロンプトで諦めてたSDXLで作るより楽しいかも
武器シリーズといってもJSONで
"weapon": "radiant magic sword, blade glowing with intense blue-white magical light, intricate hilt design, runes etched on blade emitting light",}
みたいになってる
#AIイラスト December 12, 2025
5RP
<ポストの表示について>
本サイトではXの利用規約に沿ってポストを表示させていただいております。ポストの非表示を希望される方はこちらのお問い合わせフォームまでご連絡下さい。こちらのデータはAPIでも販売しております。



