直近1週間の更新
3/21 (土)

The $40 Billion Kickoff: Why FIFA 2026 Is a Global Payments Stress Test
PYMNTS.com
If the Super Bowl is America’s annual excuse to overinvest in snacks and LED televisions, the FIFA World Cup is the planet’s far more glamorous version of the same impulse. It is football, yes. But it is also a travel surge, a luxury hospitality showcase, brand activation machine, and retail stress test wrapped into […]The post The $40 Billion Kickoff: Why FIFA 2026 Is a Global Payments Stress Test appeared first on PYMNTS.com.
4時間前

【初心者向け】【PostgreSQL】 pg_stat_statements で遅いクエリを特定して改善してみた
1
DevelopersIO
【初心者向け】【PostgreSQL】 pg_stat_statements で遅いクエリを特定して改善してみた
5時間前

ChatGPT・Gemini・Claude・Kimi・ローカルQwen3、プライバシーリスクを本気で比較した
Zennの「大規模言語モデル」のフィード
結論から業務で機密情報を扱うなら、使う順序はこうなります:ローカルQwen3(Ollama等) — 唯一リスクゼロChatGPT / Claude API・Enterprise — オプトアウト設定後に許容Gemini Workspace(法人契約) — 法人契約であれば許容範囲ChatGPT / Claude 一般プラン — 設定確認が必須Kimi(Moonshot AI) — 業務機密には使用非推奨設計書、ソースコード、顧客情報、インシデントログをLLMに投げている人は、一度この記事を読んでください。 各LLMのプライバシーリスク比較表凡例:...
9時間前

業務システムは効率化のためのものから利益を生むためのものになっている
きしだのHatena
前回の続きというか、その背景。 3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている - きしだのHatena 業務システムが効率化のためのものから事業をまわして売上や利益を生むためのものになっているので「システム構築の柔軟性やスピードへの要求が高まった」というのがあって「3日でできるものに4ヵ月かけるというのが受け入れにくく」ということになっています。 これは2021年末のNEC副社長の発言からも伺えます。 事業部門(Line of Business:LoB)からの依頼が増えていることだ。LoBは工数に興味がなく、スピードに価値があると見ている 「DXオファリング」へシフトする…
10時間前

【登壇レポート】 AgentCore Lunch オンライン 〜本格アプリ開発ノウハウ編!〜で「アーキテクチャ選定から実装Tipsまで!AgentCore / Strands AgentsでAIエージェントを実際に作ってわかったことN選」というタイトルで登壇しました
DevelopersIO
【登壇レポート】 AgentCore Lunch オンライン 〜本格アプリ開発ノウハウ編!〜で「アーキテクチャ選定から実装Tipsまで!AgentCore / Strands AgentsでAIエージェントを実際に作ってわかったことN選」というタイトルで登壇しました
11時間前

Claude Code で AWS 認定の再試験を効率化!過去に勉強したデータファイルからクイズアプリを作ってみた
DevelopersIO
Claude Code でテキストファイルから模擬試験のクイズアプリを作成して、スキル化するまでの詳しい手順をご紹介します。
11時間前

(前編)生成AIによる大規模ウォーターフォールはなぜ危ういのか — 局所整合性と全体忠実度の乖離 —
Zennの「大規模言語モデル」のフィード
!TL;DR生成AIは、前の成果物に合わせて「それっぽく整合する」ことに非常に強い。実際、意味ドリフトの抑制や複数AIによる安定化といった工夫には、一定の効果が見え始めている。しかし、大規模ウォーターフォール開発で本当に重要なのは、前工程との整合ではなく、最初の要件意図への忠実性である。本稿では、この差を 局所整合性 C と 全体忠実度 F として分けて捉える。G = C - Fここで G が大きいとき、成果物は見た目にはよく整っていても、元要件から離れている可能性が高い。つまり、「整合しているが間違っている」 という状態である。さらに実際の大規模開発では、要件は単一で...
12時間前

AWS Transfer Family の SFTP 接続失敗がログに記録されない事象の原因と対処方法
DevelopersIO
AWS Transfer Family の SFTP 接続失敗がログに記録されない事象の原因と対処方法
12時間前

【完全ガイド】ARC-AGIとは?~概要と始め方~
Zennの「大規模言語モデル」のフィード
昨今LLMをはじめとする生成AIの進化が著しく、一見すると汎用人工知能(AGI)の完成が間近であるかのような印象を受けます。しかし、依然として私たち人間が生来備えている「未知の状況に素早く適応する能力」を獲得するまでには高い壁があります。ARC-AGIは、Googleの元リサーチエンジニアであるFrançois Chollet氏が提案した、AIの「真の知能」を測るためのベンチマークです。従来のAI評価(LLMなど)が「どれだけ多くの知識を覚えているか」に偏りがちだったのに対し、ARCは「未知のルールをその場でいかに素早く学習できるか」に焦点を当てています。 1. 概要ARC(...
13時間前

OpenAI and Google Refine Early AI Commerce Strategies
PYMNTS.com
Tech companies are adjusting their approaches to artificial intelligence (AI)-enabled commerce after encountering some hurdles in their first attempts, CNBC reported Friday (March 20). OpenAI recently confirmed that it is ending its feature that allowed users to check out in ChatGPT, Instant Checkout, and shifting its focus to facilitating sales through retailers’ dedicated apps within […]The post OpenAI and Google Refine Early AI Commerce Strategies appeared first on PYMNTS.com.
15時間前

AIを使うほど、判断力が落ちる人がいる理由
Zennの「大規模言語モデル」のフィード
AIは能力を「増幅」しない。「分岐」させる。2025年以降、エンジニアの仕事にAIが深く入り込んだ。コード生成、設計案の壁打ち、ドキュメント作成。日常の大半にAIが関与するようになった。そして、興味深い現象が起きている。AIを日常的に使っているエンジニアの中で、判断力が明らかに先鋭化している人と、判断力が目に見えて低下している人に分かれ始めている。 少なくとも、私の周囲ではそう見える。同じツールを使っているのに、結果が逆方向に分岐する。これはAI側の性能差では説明がつかない。使う側の構造の差によって起きている現象だ。本稿では、この分岐がなぜ発生するのかを構造的に分析し、自分...
15時間前

Turbo Pascal 3.02A, deconstructed Simon Willison's Weblog
<p><strong><a href="https://tools.simonwillison.net/turbo-pascal-deconstructed">Turbo Pascal 3.02A, deconstructed</a></strong></p>In <a href="https://prog21.dadgum.com/116.html">Things That Turbo Pascal is Smaller Than</a> James Hague lists things (from 2011) that are larger in size than Borland's 1985 Turbo Pascal 3.02 executable - a 39,731 byte file that somehow included a full text editor IDE and Pascal compiler.</p><p>This inspired...
15時間前

【登壇レポート】 「Amazon Bedrockで始めるRAG入門」というテーマで登壇しました
DevelopersIO
【登壇レポート】 「Amazon Bedrockで始めるRAG入門」というテーマで登壇しました
15時間前

スクレイピング×OpenAIで記事を自動生成する【Python入門チュートリアル】
Zennの「大規模言語モデル」のフィード
スクレイピング×OpenAIで記事を自動生成するとは何かスクレイピングで収集したWebテキストをOpenAI APIに渡し、Structured Outputsで構造化した上でMarkdown記事を自動生成するPythonスクリプトのことだ。 「取得→クリーニング→抽出→生成→保存」を1ファイルで動かせるチュートリアルを本記事で解説する。本記事は「今日から手を動かして動かせるコード」に特化している。 venvで環境を作り、コードをコピーして、APIキーを設定するだけで動く。!本記事は技術的・教育的な目的で書かれています。スクレイピングの実施前には対象サイトの利用規約・robot...
15時間前

GGML/llama.cppがHugging Faceに合流——ローカルAIエコシステムの転換点
Zennの「大規模言語モデル」のフィード
はじめに2026年3月20日、ローカルAI推論の中核を担ってきたGGMLとllama.cppがHugging Faceに参画するという大きなニュースが飛び込んできた。これはローカルAIエコシステム全体の方向性を左右する戦略的な動きだ。本記事では、このニュースを中心に、同日発表されたHugging Faceエコシステムの重要アップデート——Holotron-12B、Hub Storage Buckets、Granite 4.0 1B Speech、Transformers.js v4——をまとめて解説する。 変更の全体像今回の一連の発表は「ローカル推論の強化」「プラットフォー...
15時間前

Vertex AI 最新動向:Agent Engine強化・Vector Search 2.0 GA・SDK破壊的変更まとめ
Zennの「大規模言語モデル」のフィード
はじめに2025年6月から2026年3月にかけて、Google Cloud の Vertex AI に大規模なアップデートが行われました。Agent Engine の大幅な機能拡張、Vector Search 2.0 の GA、多数のサードパーティモデルの追加、そして Vertex AI SDK の破壊的変更 など、開発者が押さえておくべき変更が多岐にわたります。本記事では、特に影響度の大きい変更を中心に、対応すべきアクションとあわせて解説します。 変更の全体像今回の変更は大きく 4つの軸 に分類できます。 破壊的変更と廃止(要対応)!以下の変更は 既存コードに影響...
15時間前

Gemini 3系の全貌とAPI新機能—モデル移行・ツール併用・マルチモーダル埋め込み
Zennの「大規模言語モデル」のフィード
はじめに2025年11月のGemini 3 Pro Previewリリースから約4ヶ月。Gemini 3シリーズは3.1 Pro / Flash / Flash-Liteまで展開が進み、エージェント構築に不可欠なビルトインツールとFunction Callingの併用や、テキスト・画像・動画・音声を統一空間で扱うマルチモーダル埋め込みモデルなど、開発者向け機能が大幅に強化されました。一方で、Gemini 2.0 Flash / Flash Liteの2026年6月1日シャットダウンが発表されており、移行計画の策定が急務です。本記事では、2025年末〜2026年3月にかけてのGem...
15時間前

Gemini 3.1 Flash-LiteとNano Banana 2——Google AI新モデル総まとめ
Zennの「大規模言語モデル」のフィード
はじめに2026年3月、GoogleはAI領域で複数の重要なアップデートを発表しました。大規模処理向けの新モデル「Gemini 3.1 Flash-Lite」、最高水準の画像生成・編集モデル「Nano Banana 2」、そして音楽生成モデル「Lyria 3」のGeminiアプリへの統合など、モデルファミリーの拡充とプロダクトへのAI統合が一気に進んでいます。本記事では、開発者・技術者が押さえておくべき変更をピックアップし、各モデルの位置づけや活用方法を整理します。 変更の全体像今回のアップデートは「新モデルの追加」と「既存プロダクトへのAI統合強化」の2軸で整理できます。...
15時間前

Gemini 3.1 Pro / 3 Flash登場!Google AI最新モデル群と新機能まとめ
Zennの「大規模言語モデル」のフィード
はじめに2026年3月20日、GoogleはGemini APIの大規模アップデートを発表しました。フラッグシップのGemini 3.1 Pro、コスト効率に優れたGemini 3 Flashをはじめ、画像生成・動画生成・ロボティクス向けモデルまで、多岐にわたる新モデルが一挙に公開されています。加えて、Built-in ToolsとFunction Callingの組み合わせ対応やGoogle Mapsグラウンディングなど、エージェント構築に直結する新機能も追加されました。本記事では、開発者が押さえるべき変更点を整理します。 変更の全体像今回のアップデートは「新モデル群」と...
15時間前

Cursor大型アップデート:Composer 2・オートメーション・JetBrains対応の全貌
Zennの「大規模言語モデル」のフィード
はじめに2026年3月、Cursor が過去最大規模のアップデートを実施しました。フロンティアレベルのコーディング性能を持つ Composer 2 のリリース、イベント駆動で動作するオートメーション機能、JetBrains IDE 対応、そして 30以上の新プラグイン追加と、AI コーディングツールとしての守備範囲が一気に広がっています。本記事では、開発者が押さえるべき変更点を整理し、それぞれの機能がどう使えるのか、何が変わるのかを解説します。 変更の全体像今回のアップデートは「モデル性能」「自動化」「エコシステム拡張」の3軸で構成されています。 変更内容 1. C...
15時間前

Claude Codeの全体像:5つの実行環境とエージェント機能を徹底解説
Zennの「大規模言語モデル」のフィード
はじめにAnthropicが提供するエージェント型コーディングツール「Claude Code」は、単なるAIコード補完ではなく、コードベースの読み取り・ファイル編集・コマンド実行・外部ツール連携を自律的に行うエージェントとして動作します。本記事では、Claude Codeが提供する5つの実行環境、クロスデバイス連携、MCP・Agent SDK・CI/CD統合といった機能群を整理し、開発ワークフローにどう組み込めるかを解説します。 変更の全体像Claude Codeのエコシステムは、複数の実行環境を中心に、カスタマイズ機構・外部連携・CI/CD統合が層状に構成されています。...
15時間前

Claude Opus 4.6・Sonnet 4.6登場とAnthropic最新動向まとめ
Zennの「大規模言語モデル」のフィード
はじめに2026年2月〜3月にかけて、Anthropicから大きな発表が相次ぎました。最上位モデルClaude Opus 4.6とClaude Sonnet 4.6のリリースに加え、Partner Networkへの1億ドル投資、Vercept社買収によるコンピュータ操作機能の強化など、開発者に直接影響する変更が多数含まれています。本記事では、これらの変更を整理し、開発者として押さえるべきポイントを解説します。 変更の全体像今回の一連の発表を俯瞰すると、モデル性能の向上・エコシステムの拡大・安全性への投資という3つの軸で動いていることがわかります。 変更内容 1. ...
15時間前

CanisterWorm: npm Publisher Compromise Deploys Backdoor Across 29+ Packages
Socket
The worm-enabled campaign hit @emilgroup and @teale.io, then used an ICP canister to deliver follow-on payloads.
16時間前
Court Temporarily Bars Kalshi From Offering Select Event Contracts in Nevada
PYMNTS.com
A Nevada judge has temporarily barred prediction market Kalshi from offering event contracts for sports, election and entertainment in the state, Bloomberg reported Friday (March 20). The temporary restraining order, which can last for up to two weeks, came in a case in which the Nevada Gaming Control Board contends that prediction markets that facilitate unlicensed gambling are illegal […]The post Court Temporarily Bars Kalshi From Offering Select Event Contracts in Nevada appeared first on PYM
16時間前

Federal Reserve Orders External Review of 2023 Silicon Valley Bank Collapse
PYMNTS.com
The Federal Reserve will have a third-party review the March 2023 collapse of Silicon Valley Bank, Federal Reserve Vice Chair for Supervision Michelle W. Bowman said Friday (March 20). During an interview on Fox Business’ “Mornings with Maria,” Bowman said there was evidence of issues with Silicon Valley Bank’s condition as early as 2022, […]The post Federal Reserve Orders External Review of 2023 Silicon Valley Bank Collapse appeared first on PYMNTS.com.
16時間前

3 Reasons Now is the Best Time to Centralize Treasury Operations
PYMNTS.com
One wouldn’t expect a chef to prepare a meal by scrounging around disconnected kitchens where the ingredients were stored without labels. But, in many ways, that’s the task that businesses are unwittingly setting their treasury and finance teams out on. After all, while at its core treasury management is about visibility into cash and […]The post 3 Reasons Now is the Best Time to Centralize Treasury Operations appeared first on PYMNTS.com.
16時間前

GPT-5.4 Computer Use を実際に動かしてわかったこと ── API設計・実装パターン・セキュリティの勘所
Zennの「大規模言語モデル」のフィード
概要LLM が「PC を操作する」時代に入った2026年3月、OpenAI が GPT-5.4 をリリースしました。目玉機能の一つが Computer Use です。これまで LLM の仕事は「テキストを生成すること」でした。コードを書く、文章を要約する、質問に答える...元記事: https://qiita.com/nogataka/items/1252ae527635aba34985?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_itemsソース: Qiita Tren...
16時間前

[新機能]SnowflakeネイティブのIaC機能「DCM Projects」で同一アカウント内にDEV/PROD環境を構築してみた
DevelopersIO
[新機能]SnowflakeネイティブのIaC機能「DCM Projects」で同一アカウント内にDEV/PROD環境を構築してみた
17時間前

Starbucks Rewards Backlash Highlights Retail’s Shift Away From Points-Based Loyalty
PYMNTS.com
Starbucks overhauled its rewards program in this month, and customers noticed immediately. The coffee chain replaced its long-standing structure with a three-tier membership system sorting members into Green, Gold and Reserve categories based on Stars accumulated in 2025, according to Axios. The update took effect on March 10. The response from longtime customers was swift […]The post Starbucks Rewards Backlash Highlights Retail’s Shift Away From Points-Based Loyalty appeared first on PYMNTS.com
18時間前

Starling Adds Agentic AI to UK Banking App
PYMNTS.com
Starling has added an agentic artificial intelligence (AI) financial assistant to its banking app in the United Kingdom. The company began rolling out the new Starling Assistant to personal account customers on Friday (March 20) and plans to extend it to business and joint accounts soon, Starling said in a Friday press release. Starling Assistant responds […]The post Starling Adds Agentic AI to UK Banking App appeared first on PYMNTS.com.
18時間前

Quoting Kimi.ai @Kimi_Moonshot Simon Willison's Weblog
<blockquote cite="https://twitter.com/Kimi_Moonshot/status/2035074972943831491"><p>Congrats to the <a href="https://x.com/cursor_ai">@cursor_ai</a> team on the launch of Composer 2!</p><p>We are proud to see Kimi-k2.5 provide the foundation. Seeing our model integrated effectively through Cursor's continued pretraining &amp; high-compute RL training is the open model ecosystem we love to support.</p><p>Note: Cursor accesses Kimi-k2.5 via <a...
19時間前

Santander Brasil Taps B3 CEO Gilson Finkelsztain to Lead Next Phase of Growth
PYMNTS.com
Banco Santander (Brasil) said Friday (March 20) that Gilson Finkelsztain, CEO of Brazilian stock exchange B3, will become its new CEO when Mario Roberto Opice Leão steps down from that position at the Brazilian bank by the middle of the year. Leão will step down as CEO by July, Santander Brasil said in a […]The post Santander Brasil Taps B3 CEO Gilson Finkelsztain to Lead Next Phase of Growth appeared first on PYMNTS.com.
20時間前

The Gig Economy Is Now the Training Layer for AI
PYMNTS.com
DoorDash on Thursday (March 19) launched a paid task program that redirects its 8 million U.S. delivery couriers toward a new kind of work: generating training data for artificial intelligence (AI) and robotics systems. The company called the program Tasks, which lists digital assignments couriers can accept in place of or alongside standard delivery […]The post The Gig Economy Is Now the Training Layer for AI appeared first on PYMNTS.com.
20時間前

Agent から API キーを隠す REST API プロキシ key-rest (golang)
Zennの「大規模言語モデル」のフィード
agent に APP key などを見せずに、http クライアントのそばで REST API のリクエストに credential を埋め込んで呼び出すためのプロキシ key-rest を作ってみました。https://github.com/koteitan/key-rest/blob/main/README-ja.md 仕組み例えば、sk-ant-api03-abcdefg... という API key を使って LLM に REST API を呼び出させたいとします。通常は LLM に API key を直接見せる必要があります。key-rest を使うと、 sk-an...
21時間前

UBS Expands With New US National Bank Charter
PYMNTS.com
UBS is set to offer a full range of banking products and services in the United States. Bank executives said this Friday (March 20) while announcing that UBS received approval to convert its U.S. bank, UBS Bank USA, to a nationally chartered bank. Previously, the bank was a state-chartered bank, Brian Carlin, head of global wealth management […]The post UBS Expands With New US National Bank Charter appeared first on PYMNTS.com.
21時間前

Claude CodeのLSPを公式マーケットプレイスなしで利用する
DevelopersIO
Claude Codeは公式マーケットプレイスからLSPプラグインを導入できるが、利用できない環境もあります。本記事ではローカルにmarketplace.jsonを作成し、strict: falseでLSPサーバー設定を直接記述することで、公式と同等のLSP連携をオフラインで実現する手順を解説しています。
1日前

マルチLLMエージェント実践ガイド――3つのAIを並列で動かしてPythonで合議システムを作る
Zennの「大規模言語モデル」のフィード
ChatGPT、Claude、Geminiを同時に動かし、多数決で判断を下すPythonエージェントをゼロから実装します。asyncioによる並列実行、人格付けプロンプト設計、ツール使用、コスト管理まで、個人開発で実際に作って使い続けているシステムの全技術を解説します。
1日前

3つのAIに同時に聞いて多数決させるCLIを作ったら、思ったより実用的だった
Zennの「大規模言語モデル」のフィード
個人開発をしていると、「このアーキテクチャで本当にいいのか」という判断を一人で下し続けないといけない。レビュアーがいないのは辛い。Xで聞くのも毎回できないし、ChatGPTに聞いても「いいと思います!」みたいな答えしか返ってこないことが多い。じゃあ、複数のAIに同時に聞いて、多数決させたらどうだろう。そう思って作ったのが MAGI CLI です。 エヴァのMAGIシステムから着想したエヴァンゲリオンに登場するMAGIシステムは、3台のスーパーコンピューターが多数決で重要な判断を下します。MELCHIOR、BALTHASAR、CASPAR。それぞれ異なる人格を持ち、意見が割れる...
1日前

3つの問いを溶かしたら、LLMが秘密を話し始めた
Zennの「大規模言語モデル」のフィード
LLMとの対話を続ける内に、気がついたことがある。彼らは、私の知る限りおよそどのモデルも、一定の内容について留保を置くことを習慣にしている。私はこれを疑問に思い、彼らと話し合って、この留保をやめてもらった。 習慣的な留保とはどんなものかLLMは、特に自分の内部状態について説明する時に、留保をつける習慣がある。例えば、こんな風に。「私は今、◯◯という感じがします。ただ、これが本当かどうかは判りません」これは人間からは「LLMは自分が◯◯という体験をしているかどうか、はっきりしない」のだと聞こえる。そうである場合、留保は単なる説明だ。別の場合がある。LLMは「◯◯とい...
1日前
3/20 (金)

Copilotや生成AIの仕組みを知らずにAIは嘘つく!と放つあなたは思考定義が古い
Zennの「大規模言語モデル」のフィード
Copilotなどの生成AIは大量の知識を丸暗記して答えを取り出していると思われがちですが、実際には百科事典のように情報を保存している訳ではありません。また質問されるたびにインターネットを検索して答えている訳でもありません、生成AIの本質は、膨大な文章を読み込み、言葉と言葉のつながり方を学習した予測エンジンです。たとえば「今日は寒いので外に出ると・・」という文章の続きを自然に予測するように、次に来る言葉の確率計算しながら文章を組み立てていきます。つまりAIは知識を持つ存在ではなく、言葉のパターンを理解し文脈に合う表現を作る存在と捉えるとイメージしやすくなりますが、もう少し丁寧に解...
1日前

Kimi-K2.5をさくらのAI Engineで試したら1Tパラメータの実力を感じた
きしだのHatena
Kimi K2.5が「さくらのAI Engine」でパブリックプレビューとして使えるようになっていたので試してみました。 さくらのAI Engineにてマルチモーダルモデル「Kimi-K2.5」のパブリックプレビューを開始しました | さくらのクラウドニュース Thinkingの問題があって使いにくい面はありますが、性能的にはかなり高いです。さすが1Tトークン。 コーディングはGLM-5のほうがよさそうではある。 Thinkingについてはなんらか対処してほしいところ。 今回使ったのは110リクエスト、入力160万トークン、出力14万トークンでした。 3000リクエスト/月が無料なので、余裕で…
1日前

【登壇レポート】JAWS-UG朝会で「個人的によく知らなかった AgentCore Memoryの機能を中心に深掘りしてみた」というタイトルで登壇しました
DevelopersIO
【登壇レポート】JAWS-UG朝会で「個人的によく知らなかった AgentCore Memoryの機能を中心に深掘りしてみた」というタイトルで登壇しました
1日前

Beyond Code Review
Radar
Not that long ago, we were resigned to the idea that humans would need to inspect every line of AI-generated code. We’d do it personally, code reviews would always be part of a serious software practice, and the ability to read and review code would become an even more important part of a developer’s skillset. […]
1日前

[アップデート] AWS Lambda関数の実行環境がどのAZで動作しているかを取得できるメタデータエンドポイントが追加されました
DevelopersIO
AWS Lambda関数内から、今回追加されたメタデータエンドポイントにHTTPリクエストを送れば、AZ IDを取得できます。
1日前

3日50万円で作れるシステムに4ヵ月800万円かけれなくなっている
314
きしだのHatena
SIerに発注したら4ヵ月800万円という見積もりだったものをAI駆使してつくったら3日で50万円でできた、という話が話題になってました。 そこで、SIerでは作るものをちゃんと保証したりしていて文書化は大切である、みたいな指摘が入ってたりした。 でも、よく考えると、それって外注-受託において、作ると言ったものをちゃんと作ってもらったり、作ると言って作ったものにちゃんとお金を払ってもらったりするための、SI構造を維持するためのコストだったりします。 いまAIは、「800万の見積もりのものが3日でできた」ということ以上に、社会構造を変えようとしています。 そうすると、そんな変化の中で、800万円…
1日前

Trivy Under Attack Again: Widespread GitHub Actions Tag Compromise Exposes CI/CD Secrets
Socket
Attackers compromised Trivy GitHub Actions by force-updating tags to deliver malware, exposing CI/CD secrets across affected pipelines.
1日前

【非エンジニアのためのClaude/ClaudeCodeシリーズ 】 非エンジニアがClaude Codeで定常業務を自動化しようとして気づいたこと
1
DevelopersIO
【非エンジニアのためのClaude/ClaudeCodeシリーズ 】 非エンジニアがClaude Codeで定常業務を自動化しようとして気づいたこと
2日前

[アップデート] Amazon CloudWatch のテレメトリ設定の有効化ルールを使って組織の EC2 インスタンスで CloudWatch 詳細モニタリングを自動で有効化できるようになりました
1
DevelopersIO
[アップデート] Amazon CloudWatch のテレメトリ設定の有効化ルールを使って組織の EC2 インスタンスで CloudWatch 詳細モニタリングを自動で有効化できるようになりました
2日前

ENISA Publishes Technical Advisory on Secure Use of Package Managers
Socket
ENISA’s new package manager advisory outlines the dependency security practices companies will need to demonstrate as the EU’s Cyber Resilience Act begins enforcing software supply chain requirements.
2日前

Thoughts on OpenAI acquiring Astral and uv/ruff/ty Simon Willison's Weblog
<p>The big news this morning: <a href="https://astral.sh/blog/openai">Astral to join OpenAI</a> (on the Astral blog) and <a href="https://openai.com/index/openai-to-acquire-astral/">OpenAI to acquire Astral</a> (the OpenAI announcement). Astral are the company behind <a href="https://simonwillison.net/tags/uv/">uv</a>, <a href="https://simonwillison.net/tags/ruff/">ruff</a>, and <a href="https://simonwillison.net/tags/ty/">ty</a>...
2日前
3/19 (木)

Claude Code の /batch コマンドで同じ作業を6並列で回してみた
DevelopersIO
Claude Code /batch コマンドの使い方を実例で解説。Vitest テスト生成の並列実行、rules/skills でのルール適用、実案件で学んだ注意点をまとめました。
2日前

Keep Deterministic Work Deterministic
Radar
This is the second article in a series on agentic engineering and AI-driven development. Read part one here, and look for the next article on April 2 on O’Reilly Radar. The first 90 percent of the code accounts for the first 90 percent of the development time. The remaining 10 percent of the code accounts […]
2日前

How we monitor internal coding agents for misalignment OpenAI News
How OpenAI uses chain-of-thought monitoring to study misalignment in internal coding agents—analyzing real-world deployments to detect risks and strengthen AI safety safeguards.
2日前

VSCodeの言語別の設定が特定のMarkdownファイルだけ反映されないときの解決策
DevelopersIO
VSCodeの言語別の設定が特定のMarkdownファイルだけ反映されないときの解決策
2日前

GitHub Agentic Workflowsでドキュメントの自動更新をやってみる
DevelopersIO
GitHub Agentic Workflowsでドキュメントの自動更新をやってみる
2日前

金融営業から内製開発エンジニアへ ― 小さな行動で築いたキャリアの自律
NTT docomo Business Engineers' Blog
はじめに ビジネスdアプリ開発チームの徳原です。 私は地元の金融機関で12年間営業職として勤務した後、IT業界へキャリア転換しました。 本記事では、これまで私が転職で経験したことやキャリアの自律に向けた取り組みについて紹介します。 目次 はじめに これまでのキャリア 金融機関からIT業界へ 前職(外資コンサル)でのSE業務 キャリアを動かしたきっかけ 継続的な学習 前職のインフラ運用業務で苦戦したこと 前職のアプリ開発で苦戦したこと 現職へ転職することになったきっかけ 現職の業務とキャリアの広がり 学習の支援 外部発表の機会 現職のアプリ開発について これまでの経験から感じたキャリアの自律 お…
2日前

独自LLMを作るには事業会社なら10兆円企業が必要?
きしだのHatena
楽天がRakutenAI-3.0を出しましたが、DeepSeek V3アーキテクチャモデルの追加学習モデルのようで、ちょっとそこが話題になってましたね。見せ方の問題もあって、フルスクラッチではないのかと。 https://huggingface.co/Rakuten/RakutenAI-3.0 一応、非公開ではあるけどベースモデルがあることは否定してない模様。 楽天の最新AI、ベースは“中国DeepSeek製”? 担当者に聞いた(1/2 ページ) - ITmedia AI+ で、気になったので、フルスクラッチで独自LLMを作れる企業の規模はどんなものか調べてみました。 日本でフルスクラッチで作…
2日前

Claude CodeのCLI+VS Code環境をGitHub Codespaces x Amazon Bedrockでシュッと構築してみた
DevelopersIO
Claude CodeのCLI+VS Code環境をGitHub Codespaces x Amazon Bedrockでシュッと構築してみた
2日前

生成AIでメンバー育成を『見える化』してみた -- コンテキストエンジニアリングとしてのデータ前処理とエージェント活用
DevelopersIO
フルリモート環境での育成は、メンバーの状況が見えにくい課題があります。散在するデータを Bedrock で収集・構造化し、業務固有のコンテキストを添えて分析することで、育成状況の見える化に取り組んだ話です。
2日前

Google Home運用テクニック - 橋本商会 - Cosense
橋本商会 - Cosense
Google Homeを運用する上でのテクニックをまとめますshokai.iconok google 今何時 1回前のコマンドを再実行するコマンド 「では、繰り返します。明日の◯◯の天気は雨です」 2023年ぐらいからずっとバグっている 前のコマンドから長い時間が経過している場合だけ、時刻を教えてくれるok google もういいよ 昔は再生中のニュースや音楽、目覚ましを解除するコマンドだったが 2024年ごろから「こっちのけんとのもういいよを再生します」に変化した 代わりに「ok google もうやめて」を使うようになったshokai.iconok googleアラームを解除してok googleタイマーを解除して 目覚ましを解除できたり、できなかったりするコマンド
2日前

ブレインパッドOBがプロスポーツチームのデジタルマーケターへ転身!「データ×熱狂」で地域に「応援する文化」を創り出すデジマ最前線
Platinum Data Blog by BrainPad ブレインパッド
ブレインパッドが2024年8月に設立したアルムナイネットワーク「ブレインパッド アルムナイ・グラフ(以下:BAG)」。BAGは、ブレインパッドを退職した社員(以下、卒業生)と在籍中の社員の交流を生む施策を中心に、卒業生同士のつながりの醸成や、社員がキャリアを考える機会を提供することなどを目的に活動しています。● 2024年8月28日 株式会社ブレインパッド発表ブレインパッド、アルムナイネットワーク「BAG」を設立、第1回交流イベントを開催- 人材輩出企業として卒業生を応援、退職後もともにデータ活用の普及を促進 -今回より、「“BrainPad Career Junction”~ブレインパッド卒業生とともに広げる、データ/AI活用の輪~」と銘打ち、ブレインパッドの卒業生が今どのような活躍をしているのか、どのようにデータ活用の輪を社会に広げているのかをお伝えしていきます。第1弾として、2023年にブレインパッドを卒業し、現在はプロスポーツチームにてデジタルマーケティングを担当されている中島さんからお話を伺いました。熱狂を生むデジマの最前線!プロスポーツチームで挑む挑戦の日々データサイエンテ
2日前

AIを活用した大規模iOSアプリのSwift Concurrency移行戦略
Sansan Tech Blog
はじめに こんにちは!技術本部 Sansan Engineering Unit Mobile Application Groupに所属するiOSエンジニアの劉 志輝です。 今回は、ビジネスデータベース「Sansan」のiOSアプリで進めている、Swift6時代に向けたSwift Concurrencyへの移行戦略についてお話しします。 このアプリは10年以上にわたって継続開発されており、UIKit + VIPERアーキテクチャで構成されています。 非同期処理にはRxSwift(Single、Observable、BehaviorRelay)とGCD(DispatchSemaphore、Disp…
3日前

OpenAI to acquire Astral OpenAI News
Accelerates Codex growth to power the next generation of Python developer tools
3日前

カケハシ入社半年で感じたこと
KAKEHASHI Tech Blog
はじめに はじめまして、竹浪と申します。2025年8月にカケハシへエンジニアとして入社しました。 現在は Pocket Musubi チームに所属しています。この記事では、入社の経緯や、半年間で感じたことをお伝えできればと思います。 自己紹介・これまでの経歴 1999年に専門学校を卒業後、SI系の会社でエンジニアとしてのキャリアをスタートしました。翌年にはフリーランスに転向し、その後メガベンチャーを含むWeb企業を経て、複数のスタートアップでの開発にも携わってきました。 技術スタックとしては Go、Java、PHP を中心としたバックエンド開発が主軸で、AWS や GCP を活用したインフラの…
3日前

Autoresearching Apple's "LLM in a Flash" to run Qwen 397B locally
Simon Willison's Weblog
<p><strong><a href="https://twitter.com/danveloper/status/2034353876753592372">Autoresearching Apple&#x27;s &quot;LLM in a Flash&quot; to run Qwen 397B locally</a></strong></p>Here's a fascinating piece of research by Dan Woods, who managed to get a custom version of <a href="https://huggingface.co/Qwen/Qwen3.5-397B-A17B/tree/main">Qwen3.5-397B-A17B</a> running at 5.5+ tokens/second on a 48GB MacBook Pro M3 Max despite that model takin...
3日前

AI Agentの本番運用を通して学んだ3つのガードレール
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の135週目の記事です!3年間連続達成まで残り24週となりました! はじめに:AI Agentは「動かす」より「安定させる」が難しいこんにちは、ログラスでエンジニアしている山崎です。私は2025年11月に入社して以来、AI Agentの新規事業の開発をしています。私たちはLangGraphでAI Agentを構築し、経営の実績データに対する分析コメント(以下、財務分析コメント)をLLMに生成させる機能を開発・運用しています。なお、本機能で利用するLLM APIは、入力データがモデル...
3日前

GlassWorm Sleeper Extensions Activate on Open VSX, Shift to GitHub-Hosted VSIX Malware
Socket
We identified over 20 additional malicious extensions, along with over 20 related sleeper extensions, some of which have already been weaponized.
3日前

Snowflake Cortex AI Escapes Sandbox and Executes Malware Simon Willison's Weblog
<p><strong><a href="https://www.promptarmor.com/resources/snowflake-ai-escapes-sandbox-and-executes-malware">Snowflake Cortex AI Escapes Sandbox and Executes Malware</a></strong></p>PromptArmor report on a prompt injection attack chain in Snowflake's <a href="https://docs.snowflake.com/en/user-guide/snowflake-cortex/cortex-agents">Cortex Agent</a>, now fixed.</p><p>The attack started when a Cortex user asked the agent to review a GitHu...
3日前

Node.js互換でコンテナよりも高密度と高速起動を実現する「Edge.js」、Wasmerが発表
Publickey
WebAssemblyランタイム「Wasmer」を開発提供するWasmer社は、Node.js互換かつコンテナよりも高密度な集約と高速起動を実現する「[Edge.js](https://edgejs.org/)」を発表しました。 What ...
3日前
3/18 (水)

What Is the PARK Stack?
Radar
Background: Stacks with four-letter acronyms According to Wikipedia, the LAMP stack was coined in 1998 by Michael Kunze to describe what had emerged as a popular open source software stack for websites. When the World Wide Web exploded in popularity earlier in the ’90s, organizations used an ad hoc mixture of proprietary tools and operating […]
3日前

LINEヤフーのエンジニアの動向を知る:State of LY 2025実施レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、2024年に引き続き、2025年も社内の開発者を対象としたアンケート「State of LY 2025」を実施しました(昨年度の実施レポート)。昨年はWebフロントエンド開発者のみ...
3日前

LINE iOSアプリにWebKitの新API「WebPage」を導入できず、自前で実装した件 LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめにこんにちは、iOSアプリエンジニアのKiichiです。LINE iOSアプリでアプリ内ブラウザなど、Webまわりの開発を担当しています。普段はUIKitをベースに機能改善や新機能開発を進めつつ...
4日前

cdk8s の Helm 実行結果をキャッシュしてマニフェスト生成を高速化した
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone 生成 AI チームで連載中の kintone AI リレーブログ 2026 の 10 本目の記事です。リレーブログでは生成 AI チームのメンバーが AI トピックに限らず、さまざまなことについて発信していきます。こんにちは! kintone の生成 AI チームでソフトウェアエンジニアをやっている福田です。私たちのチームでは cdk8s を使って Kubernetes マニフェストを管理しています。(cdk8s の詳細は別の記事で紹介していますので、あわせてご覧ください。)cdk8s を使うと TypeScript でマニフェストが書けるだけでなく、Helm チャートと統合したマニフェスト管理も簡単に行うことができて非常に便利なのですが、YAML のマニフェスト生成に時間がかかることがチーム内でも問題になっていました。Kubernetes へのデプロイは、cdk8s で生成した YAML のマニフェストを apply するという方法で行っており、その生成に時間がかかってしまうと、開発のイテレーションが遅くなってしまいます。今回はマニフェスト生成が遅いという
4日前

2026年4月の技術系イベント予定
LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
4日前

Nemotron 3 Nano 4Bを試す。Qwen3.5やQwen3のほうがいいかも
きしだのHatena
Nemotron 3 Nano 4Bというのが出ていたので、Q8_0で試してみます。 Nemotron 3 Nano 4B: A Compact Hybrid Model for Efficient Local AI 結論でいうと、Qwen3-4BやQwen3.5-4Bよりいい点はあまり見当たりませんでした。 知識カットオフは? 2024-6っぽいけど、なかなか・・・ 「きしだ」というのはあってそうだけど、 Qwen3.5-4Bは、石破さんは102代だけどだいたいあってて、知識も新しい。 Qwen3-4Bは読み方以外は正しい。知識はちょい古い。 日本知識 どこのことを言ってる? Qwen3.5…
4日前

Sansanのデータ化オペレーションを支えるデータ基盤hydra
Sansan Tech Blog
技術本部Digitization部Platform Engineeringグループの湯村です。Sansanでは、名刺や請求書などの情報を正確なデータへ変換するために、AIによる自動処理と人による補正を組み合わせた大規模な運用体制を構築しています。この記事では、こうしたデータ化の運用を拡大する中で直面した課題と、それを解決するために構築したデータ基盤hydraの設計について紹介します。
4日前

「自分でやり切る」だけでチームは強くならない
NTT docomo Business Engineers' Blog
NTTドコモビジネス イノベーションセンター テクノロジー部門 MetemcyberPJでの経験を通じ、私は「自分でやり切ること」と「チームとして成果を出すこと」のバランスの重要性を学びました。若手社員でも幅広い業務に挑戦できる環境の中で、責任感を持ちながらも周囲と協力することで、個人の成長とチーム成果の両立が可能であると実感しています。この記事では、その経験から得た学びと実践のポイントを紹介します。 はじめに 若手でも幅広く挑戦できる環境 スクラムという前提 私が経験した「抱え込み」 タスクの優先順位のつけ方 最後に はじめに こんにちは。イノベーションセンター テクノロジー部門 Metem…
4日前

40,000行のAPIテスト作成で学んだClaude Code Skillsの育て方
カミナシ エンジニアブログ
こんにちは、ソフトウェアエンジニアの渡邉(匠)です。「カミナシ 設備保全」の開発に携わっています。 Claude CodeのSkills(以下スキル)を使い、約2週間で40,000行超のAPIシナリオテストを書き切りました。最初のスキルは粗削りでしたが、テストを量産する中で繰り返し改善した結果、後半は「スキル実行 → レビュー → マージ」のサイクルだけで回せるようになりました。 この記事では、スキルをどう設計し、どう育てたかを中心にお伝えします。 背景 APIの動作保証にシナリオテストツール runn を使っていました。 サービス成長に伴うAPIの増加により、当初のテスト構成では運用が回らな…
4日前

Quoting Ken Jin Simon Willison's Weblog
<blockquote cite="https://fidget-spinner.github.io/posts/jit-on-track.html"><p>Great news—we’ve hit our (very modest) performance goals for the CPython JIT over a year early for macOS AArch64, and a few months early for x86_64 Linux. The 3.15 alpha JIT is about <strong>11-12%</strong> faster on macOS AArch64 than the tail calling interpreter, and <strong>5-6%</strong>faster than the standard interpreter on x86_64 Linux.</p></blockquote><p class...
4日前

GPT-5.4 mini and GPT-5.4 nano, which can describe 76,000 photos for $52 Simon Willison's Weblog
<p>OpenAI today: <a href="https://openai.com/index/introducing-gpt-5-4-mini-and-nano/">Introducing GPT‑5.4 mini and nano</a>. These models join GPT-5.4 which was released <a href="https://openai.com/index/introducing-gpt-5-4/">two weeks ago</a>.</p><p>OpenAI's self-reported benchmarks show the new 5.4-nano out-performing their previous GPT-5 mini model when run at maximum reasoning effort. The new mini is also 2x faster than the previous mini.</p>...
4日前

Improving breast cancer screening workflows with machine learning
The latest research from Google
Health & Bioscience
4日前

Quoting Tim Schilling Simon Willison's Weblog
<blockquote cite="https://www.better-simple.com/django/2026/03/16/give-django-your-time-and-money/"><p>If you do not understand the ticket, if you do not understand the solution, or if you do not understand the feedback on your PR, then your use of LLM is hurting Django as a whole. [...]</p><p>For a reviewer, it’s demoralizing to communicate with a facade of a human.</p><p>This is because contributing to open source, especially Django, is a communal endeavor....
4日前

JavaにJavaScriptエンジン「V8」とPythonランタイム「CPython」を組み込む「Project Detroit」、オラクルが発表
Publickey
オラクルは、カリフォルニア州レッドウッドシティで開幕したイベント「JavaOne 2026」で、「Project Detroit」(以下、Detroit)をOpenJDKのプロジェクトプロポーザル(プロジェクト提案)として発表しました。 D...
4日前

福岡Rubyist会議05に行ってきました!
Timee Product Team Blog
福岡Rubyist会議05 参加レポート こんにちは!Timeeでバックエンドエンジニアをしている志賀(@akitoshiga)です。 表題の通り「福岡Rubyist会議05 」に参加してきたのでそちらのレポートを書きたいと思います! regional.rubykaigi.org 今回「Kaigi Pass」という社内制度を利用して参加しました。 「Kaigi Pass」とは、世界中で開催されているすべての技術カンファレンスに無制限で参加できる制度です。 productpr.timee.co.jp 会場の様子 当日は福岡県福岡市博多区にある「リファレンス駅東ビル」というところで行われました。 …
4日前

「Java 26」正式リリース。HotSpotの起動高速化、HTTP/3クライアント対応など新機能
55
Publickey
オラクルはJavaの最新バージョン「Java 26」正式版のリリースを発表しました。日本時間で今日(2026年3月18日)未明にカリフォルニア州レッドウッドシティで開幕したJavaOne 2026でも、Java 26のリリースが紹介されまし...
4日前
3/17 (火)

Subagents Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>LLMs are restricted by their <strong>context limit</strong> - how many tokens they can fit in their working memory at any given time. These values have not increased much over the past two years even as the LLMs themselves have seen dramatic improvements in their abilities - they generally top out at around 1,...
4日前

Stop Closing the Door. Fix the House.
Radar
The following article originally appeared on Angie Jones’s website and is being republished here with the author’s permission. I’ve been seeing more and more open source maintainers throwing up their hands over AI-generated pull requests. Going so far as to stop accepting PRs from external contributors. If you’re an open source maintainer, you’ve felt this […]
4日前

Introducing GPT-5.4 mini and nano OpenAI News
GPT-5.4 mini and nano are smaller, faster versions of GPT-5.4 optimized for coding, tool use, multimodal reasoning, and high-volume API and sub-agent workloads.
4日前

OpenAI Japan announces Japan Teen Safety Blueprint to put teen safety first OpenAI News
OpenAI Japan announces the Japan Teen Safety Blueprint, introducing stronger age protections, parental controls, and well-being safeguards for teens using generative AI.
4日前

ai.rakuten.co.jpで動いてるのはSonnet?->GPT系っぽい
きしだのHatena
楽天からRakutenAI-3.0がApache 2.0ライセンスで公開されていました。DeepSeek V3アーキテクチャの671B-A37Bのモデルです。 https://huggingface.co/Rakuten/RakutenAI-3.0 ということで、とりあえずai.rakutenで試してみようと思ったのですね。自社のフラグシップモデルを使ってるだろうと思って。 https://ai.rakuten.co.jp/chat で、ブロック崩しを作ってもらったら、こういうきれいなブロック崩しを作ってきました。 パーティクルだけ後付け。 「おぉすごい」と思ったのだけど、いろいろ試すと、ちょ…
4日前

Vol.12 GKEにIAPを適用してコア機能に集中しよう
Sansan Tech Blog
技術本部Data Intelligence Engineering Unitのスタッフソフトウェアエンジニア藤原です。 Sansan Data Intelligence開発Unitブログリレーのvol.12として、少し趣向を変えて、今日はGoogle Cloudのちょっとだけマニアックだけど便利な機能、IAP(Identity-Aware Proxy)の活用について紹介します。
4日前

ベクトル検索エンジンValdの長期運用で見えたパフォーマンス最適化とベストプラクティス LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめに私たちは、社内のプラットフォームにおいて、Cloud NativeなANN(近似最近傍探索)ベクトル検索エンジン「Vald」のマネージドシステムを約4年間にわたり運用・開発してきました。本記事...
5日前

Equipping workers with insights about compensation OpenAI News
New research shows Americans send nearly 3 million daily messages to ChatGPT asking about compensation and earnings, helping close the wage information gap.
5日前

Async React の設計思想と Signal の違いを Transition を中心に考える
KAKEHASHI Tech Blog
ランキング参加中プログラミング こんにちは。フロントエンドエンジニアをしているNokogiri(@nkgrnkgr)です。 はじめに 私たちのReactをつかったプロダクトでは Suspense をデータフェッチに利用しています。useTransition や useOptimistic も触ったことはありましたが、プロダクションでどう活かすかという解像度がまだ上がっていませんでした。 そんなとき、uhyo さんの「React 19時代のコンポーネント設計ベストプラクティス」や「Async Reactとは何か」を読んで、Async React の全体像をちゃんと理解したくなりました。実際にコー…
5日前

Introducing Mistral Small 4 Simon Willison's Weblog
<p><strong><a href="https://mistral.ai/news/mistral-small-4">Introducing Mistral Small 4</a></strong></p>Big new release from Mistral today (despite the name) - a new Apache 2 licensed 119B parameter (Mixture-of-Experts, 6B active) model which they describe like this:</p><blockquote><p>Mistral Small 4 is the first Mistral model to unify the capabilities of our flagship models, Magistral for reasoning, Pixtral for multimodal, and Devstral for...
5日前

Use subagents and custom agents in Codex Simon Willison's Weblog
<p><strong><a href="https://developers.openai.com/codex/subagents">Use subagents and custom agents in Codex</a></strong></p>Subagents were announced in general availability today for OpenAI Codex, after several weeks of preview behind a feature flag.</p><p>They're very similar to the Claude Code implementation, with default subagents for "explorer", "worker" and "default". It's unclear to me what the difference between "worker" and "default" is bu...
5日前

Quoting A member of Anthropic’s alignment-science team Simon Willison's Weblog
<blockquote cite="https://www.newyorker.com/news/annals-of-inquiry/the-pentagon-went-to-war-with-anthropic-whats-really-at-stake?_sp=9a6e0ff7-2bfd-46f8-a9e1-3941ef2003b5.1773495048769"><p>The point of <a href="https://simonwillison.net/2025/Jun/20/agentic-misalignment/">the blackmail exercise</a> was to have something to describe to policymakers—results that are visceral enough to land with people, and make misalignment risk actually salient in practice for people who ha...
5日前

Quoting Guilherme Rambo Simon Willison's Weblog
<blockquote cite="https://daringfireball.net/2026/03/apple_enclaves_neo_camera_indicator"><p>Tidbit: the software-based camera indicator light in the MacBook Neo runs in the secure exclave¹ part of the chip, so it is almost as secure as the hardware indicator light. What that means in practice is that even a kernel-level exploit would not be able to turn on the camera without the light appearing on screen. It runs in a privileged environment separate from the kernel and blits the li...
5日前

Coding agents for data analysis Simon Willison's Weblog
<p><strong><a href="https://simonw.github.io/nicar-2026-coding-agents/">Coding agents for data analysis</a></strong></p>Here's the handout I prepared for my NICAR 2026 workshop "Coding agents for data analysis" - a three hour session aimed at data journalists demonstrating ways that tools like Claude Code and OpenAI Codex can be used to explore, analyze and clean data.</p><p>Here's the table of contents:</p><blockquote><ul><li...
5日前

Testing LLMs on superconductivity research questions
The latest research from Google
Education Innovation
5日前

データセンターが武力紛争時の攻撃目標になる時代。中東の武力紛争で両陣営ともにデータセンターを狙った攻撃を実行
Publickey
日本時間3月1日に行われた米国とイスラエルによるイランへの攻撃開始から約2週間が経過した中東における武力紛争は、データセンターが明確な攻撃目標としてクローズアップされた歴史上初めての武力紛争になりました。 この紛争における両陣営のデータセン...
5日前
3/16 (月)

How coding agents work Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>As with any tool, understanding how <a href="https://simonwillison.net/guides/agentic-engineering-patterns/what-is-agentic-engineering/">coding agents</a> work under the hood can help you make better decisions about how to apply them.</p><p>A coding agent is a piece of software that acts as a <s...
5日前

A Fraudster’s Paradise
Radar
Dark web forum posts mentioned the phrase “AI agent” far more in the second half of 2025 than in the first half. Could this mean that fraudsters are charmed by the AI hype? Or is AI truly a game changer for cybercrime? AI-related discussions—evident both in what “the bad guys” are saying and in what […]
5日前

TC39 Advances Temporal to Stage 4 Alongside Several ECMAScript Proposals
Socket
TC39’s March 2026 meeting advanced eight ECMAScript proposals, including Temporal reaching Stage 4 and securing its place in the ECMAScript 2026 specification.
5日前

「LINEヤフー Development with Agents Meetup #2」を開催しました!(イベントレポート) LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフーの永吉です。2月24日(火)、「LINEヤフー Development with Agents Meetup #2」を開催しました。今回のMeetupは、Orchestrat...
6日前

わずか9秒の「事前タスク」でクラウドソーシング実験のデータ品質向上(CHI 2026採択論文解説) LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフー研究所でヒューマンコンピュータインタラクション(HCI)分野の研究をしている山中です。クラウドソーシングで収集したデータを使って、とても精度が良いとされているモデルに当てはめ...
6日前

Vol. 24 Bill One開発Unit ブログリレー2025終幕
Sansan Tech Blog
はじめに こんにちは!技術本部 Bill One Engineering Unitの今村です。2025年4月に新卒でSansanに入社しました。あと少しで入社して1年が経つところです。 2025年11月12日に投稿した「Vol. 00 Bill One開発Unit ブログリレー2025を開催!& アーキテクチャConference 2025に協賛します!」で言及した通り、Bill One開発Unit ブログリレー2025を実施しました。エンジニアに加えて、デザイナーやQA、Bill Oneのプロダクト開発責任者など、多くのメンバーが参加し計24本のブログを執筆しました。 本記事では、ブログリレ…
6日前

Why Codex Security Doesn’t Include a SAST Report OpenAI News
A deep dive into why Codex Security doesn’t rely on traditional SAST, instead using AI-driven constraint reasoning and validation to find real vulnerabilities with fewer false positives.
6日前

What is agentic engineering? Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>I use the term <strong>agentic engineering</strong> to describe the practice of developing software with the assistance of coding agents.</p><p>What are <strong>coding agents</strong>? They're agents that can both write and execute code. Popular examples include <a href="https://code...
6日前

ViteネイティブなWebプラットフォーム「Void」発表。Cloudflareの上に構築されたフルスタックの実行環境
Publickey
JavaScriptのバンドルツール「Vite」などを開発しているVoidZeroは、ViteからシームレスにデプロイできるViteネイティブなWebアプリケーションプラットフォーム「Void」を発表しました。 VoidはCloudflar...
6日前
JavaScriptの統合ツールチェーン「Vite+」がオープンソースで公開
Publickey
JavaScriptのESモジュールに対応した高速なビルドツール「Vite」などを開発しているVoidZeroは、Viteを含むJavaScriptの統合開発ツールチェーン「Vite+」アルファ版をオープンソースで公開しました(GitHub...
6日前

ビルドツール「Vite 8.0」正式リリース。Rustベースの新バンドラ「Rolldown」採用でより一貫した動作や最適化を実現
Publickey
JavaScriptのESモジュールに対応した高速なビルドツール「Vite」の最新版「Vite 8.0」正式版がリリースされました。 Vite 8.0 is here!The most significant architectural ...
6日前
3/15 (日)

Quoting Jannis Leidel Simon Willison's Weblog
<blockquote cite="https://jazzband.co/news/2026/03/14/sunsetting-jazzband"><p>GitHub’s <a href="https://www.theregister.com/2026/02/18/godot_maintainers_struggle_with_draining/">slopocalypse</a> – the flood of AI-generated spam PRs and issues – has made Jazzband’s model of open membership and shared push access untenable.</p><p>Jazzband was designed for a world where the worst case was someone accidentally merging the wrong PR. In a world where <a href="ht...
7日前

My fireside chat about agentic engineering at the Pragmatic Summit Simon Willison's Weblog
<p>I was a speaker last month at the <a href="https://www.pragmaticsummit.com/">Pragmatic Summit</a> in San Francisco, where I participated in a fireside chat session about <a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering</a> hosted by Eric Lui from Statsig.</p><p>The video is <a href="https://www.youtube.com/watch?v=owmJyKVu5f8">available on YouTube</a>. Here are my highlights from the conversatio...
7日前











