直近1週間の更新
2/28 (土)

Front Desk and Help Desk Are Now Manned by AI
PYMNTS.com
The corporate front desk and the internal help desk are becoming faster, smarter and always on. New data from RingCentral and ServiceNow shows AI systems handling inbound calls and resolving IT tickets at scale. AI’s New Front Desk One significant example of artificial intelligence moving into the customer experience layer is the rapid adoption […]The post Front Desk and Help Desk Are Now Manned by AI appeared first on PYMNTS.com.
12分前
2/27 (金)

Google Cloud Storage で大量のオブジェクト削除を工夫してやってみる
DevelopersIO
Google Cloud Storage で大量のオブジェクト削除を工夫してやってみる
2時間前

npm v11.10.0 の新機能 min-release-age を試してみた(サプライチェーン攻撃対策)
1
DevelopersIO
この記事では npm v11.10.0 で追加された min-release-age について紹介します。実際の動作検証や pnpm と safe-chain との比較もあわせて解説します。
2時間前

InComm Payments and SKUx Launch Blockchain Aid Payments Platform
PYMNTS.com
InComm Payments and SKUx announced Friday morning (Feb. 27) a strategic partnership to improve how digital payments are distributed for humanitarian aid and other applications for emerging markets. The announcement lands as disaster recovery funding faces tighter scrutiny, shifting more responsibility to state and local agencies. The companies said they will pair InComm Payments’ […]The post InComm Payments and SKUx Launch Blockchain Aid Payments Platform appeared first on PYMNTS.com.
3時間前

【Security Hub修復手順】[RDS.15] RDS DBクラスターは複数のアベイラビリティーゾーンに対して構成されるべき
DevelopersIO
AWS SecurityHub 基礎セキュリティのベストプラクティスコントロール修復手順をご紹介します。
4時間前

[アップデート] Amazon S3のサーバーアクセスログにソースリージョン情報が追加されました
DevelopersIO
サーバーアクセスログの末尾にソースリージョン情報が追加されて、リージョン情報把握が簡単に。ログ形式に依存している処理などは変更必須なケースも。
6時間前

Trend Vision OneのCredits残高が少なくなったらアラート通知を受け取れるように設定してみた
DevelopersIO
Trend Vision OneのCredits残高が少なくなったらアラート通知を受け取れるように設定してみた
6時間前

【Golang】AI駆動×テスト駆動×テーブル駆動
Zennの「大規模言語モデル」のフィード
はじめにLLMによるコード生成が当たり前になった今、エンジニアの課題にどう書くかに加えてどう正しさを担保するかが重要視されるようになってきているのかなと思います。正しさの担保をするためには、AIの特徴を掴み厳密なルールの制定や評価指標の設定が重要になってきます。今回は、今参加しているチームで行っているテーブル駆動(TDT)、テスト駆動(TDD)、AI駆動(AI-Driven)を組み合わせた、開発フローについての記事です。チームは昨年の12月に結成されたプロダクトの立ち上げフェーズなこともあり、最初からAI駆動を行うための技術選定を行ってきました。その中で、なぜこの三つの組み合わ...
6時間前

Gemini・Claude・ChatGPT・GrokでAI会議したら神々の遊びだった
Zennの「大規模言語モデル」のフィード
Geminiで生成したイメージ!とりあえず結果だけ見たい!という方は、目次の 「5.やってみた」 へどうぞ。想像以上にカオスな議論が繰り広げられています😂 1. はじめに:前回のゲーム開発秘話前回レッサーパンダの連打ゲームを作ったとき、点数0の状態で公開すべきか、GeminiとClaude両方に聞いてみると意見が真っ二つだったのは本当にAIっておもしろいなあ~と思いました。Geminiの意見(クリックで展開)結論から言うと、公開直前に 「0にリセット(初期化)してから公開」 するのが絶対におすすめです!(え!意見割れたよ!と言うと)まじですか!!AI同士で完全にバ...
6時間前

Agent Swarm:オープンソースのマルチエージェント・フレームワークってやつを調査した
Zennの「大規模言語モデル」のフィード
【News】Agent Swarm:自己学習機能を備えたオープンソースのマルチエージェント・フレームワーク公式リリースおよび関連ドキュメント:公式 Git HubHacker News まとめDockerで動作し、複雑なタスクを自動分解、専門エージェントへ動的に割り当てるマルチエージェント・フレームワーク。実行結果からプロンプトを自動最適化する「自己学習ループ」により、継続的な精度向上を実現。オープンソース(OSS)として提供され、特定のプラットフォームに依存しない柔軟なカスタマイズが可能。 Agent Swarmって何? 私の疑問と解消 疑問1. コ...
6時間前

[小ネタ] GuardDutyの招待ベース管理でEC2 Malware Protectionを有効化するには招待解除が必要です
DevelopersIO
[小ネタ] GuardDutyの招待ベース管理でEC2 Malware Protectionを有効化するには招待解除が必要です
6時間前

Making Digital Payments Feel Human Is Next Competitive Edge
PYMNTS.com
Watch more: What’s Next in Payments With Paymentus’ Nicole Haskins The FinTech landscape has overindexed on innovation. But in an operational landscape defined by automation, predictive analytics, and invisible payments, the most important innovation in financial technology may ultimately be an attitudinal one. “My word of the year is ‘service,’” Nicole Haskins, director of […]The post Making Digital Payments Feel Human Is Next Competitive Edge appeared first on PYMNTS.com.
6時間前

One-Third of Millennials Now Rely on Gig Payments and Tips as Primary Income
PYMNTS.com
Nearly one-third of millennials depend on transactional payouts from gig work and tips as their main source of income, replacing traditional paychecks with a piecemeal approach to earning that demands instant access to money. This finding from the PYMNTS Intelligence report “Instant Payouts: The New Paycheck for a Real-Time Economy” highlighted a shift in […]The post One-Third of Millennials Now Rely on Gig Payments and Tips as Primary Income appeared first on PYMNTS.com.
6時間前

Grocery Battle Shifts to Loyalty as Walmart Dominates and Amazon Expands Digital
PYMNTS.com
When it comes to the Amazon-Walmart competition, grocery has become a key battleground. Why? It’s the closest thing U.S. retail has to a weekly subscription. Win the cart, and you earn repeat trips and durable customer habits. That’s why recent consumer-tracking data showing Walmart’s grocery penetration at a record 72% of U.S. households lands as […]The post Grocery Battle Shifts to Loyalty as Walmart Dominates and Amazon Expands Digital appeared first on PYMNTS.com.
6時間前

Mastercard: Small Business Growth Hinges on Using Tech Better, Not Chasing Trends
PYMNTS.com
Watch more: What’s Next In Payments With Mastercard’s Mark Barnett Strategic narratives in payments can come with some loaded words. Artificial intelligence, institutional blockchain and real-time rails are routinely positioned as the decisive forces shaping the next cycle. Mark Barnett, global head of small and medium enterprises at Mastercard, told PYMNTS during a conversation […]The post Mastercard: Small Business Growth Hinges on Using Tech Better, Not Chasing Trends appeared first on PYMNTS
6時間前

サードパーティCookieなしでもマルチタッチアトリビューションは可能か?― Cookie廃止時代のマーケティング計測を考える
DevelopersIO
サードパーティCookieなしでもマルチタッチアトリビューションは可能か?― Cookie廃止時代のマーケティング計測を考える
7時間前

AWSサイト間VPN接続のルーティングオプションが動的か静的かでダウンロードできるサンプルConfigファイルが異なる
1
DevelopersIO
サンプルConfigファイルをダウンロードするときはデバイスタイプを指定します。デバイスタイプごとに、サイト間VPN接続のルーティングオプションである「動的/静的」に対応しているかどうかが異なります。どちらにも対応しているデバイスタイプの場合、ダウンロードできるファイルの内容が異なります。
7時間前

10日間のインターンでk8s Self-hosted Runnerを構築し社内のCI/CD基盤を新たに整備した話
エムスリーテックブログ
はじめまして! 2026年の2月後半に10日間、エムスリーのAI・機械学習チームでインターンをしていた竜です。 この記事では、セルフホストされた社内のCI/CD基盤を新しく構築し、その上で弊チームにおいてデプロイ時間を約半分短縮した事例について紹介します。 合わせて、1人の学生の視点から見たエムスリーの雰囲気であったり良さを紹介できればと思います! 最終日に食べたランチ
7時間前

SnowflakeでData Metric Functionsによりデータ品質問題を検知したらメール通知できる機能を試してみた
DevelopersIO
SnowflakeでData Metric Functionsによりデータ品質問題を検知したらメール通知できる機能を試してみた
7時間前

Aurora MySQL で FreeLocalStorage に余裕があっても CloudWatch Logs エクスポート前にログが削除される原因と対処方法を教えてください
1
DevelopersIO
Aurora MySQL で FreeLocalStorage に余裕があっても CloudWatch Logs エクスポート前にログが削除される原因と対処方法を教えてください
7時間前

ウォンテッドリーの推薦システムを支えるMLOps -現状の取り組みと課題-
3
Wantedly Engineer Blog
はじめにウォンテッドリーでデータサイエンティストとして働いている市村です。私たちのチームは Wantedly Vi...
8時間前

AI開発会社を選ぶ際に重要な技術ポイントとは?
Zennの「大規模言語モデル」のフィード
AI開発会社を選ぶ技術チェックポイント10選:PoC止まりを防ぐ“運用設計”AI開発会社選びで見るべきは「モデル精度」だけではありません。データ設計、評価指標、MLOps、監視、セキュリティまで“本番運用”を前提に確認しないとPoC止まりになります。CTO向けに技術チェックポイントと質問リストを整理します。 先に結論:AIは“開発”より“運用”で差が出るAIプロジェクトの失敗要因は、技術力不足よりも次の欠落が多いです。成功指標(Acceptance Criteria)が曖昧データの品質・責任境界が不明本番監視・再学習・コスト管理が未設計セキュリティ/コンプライア...
9時間前

拡張機能や Selenium に頼らない、LLM ネイティブなブラウザ開発入門
Zennの「大規模言語モデル」のフィード
本記事は何?本記事は、Firefox フォークの Floorp を開発している大学 2 年生が、未踏 IT(2025)採択プロジェクト 「Floorp OS」 の開発で得た知見を、「拡張機能や Selenium に頼らず、ブラウザ内部に LLM 実行基盤を組み込む」 という観点で公開するために書いた記事です。文章の校正などに生成 AI を用いていますが、設計判断や実装方針は実装経験に基づいて記述します。LLM ブラウザの実装方法は複数あると思いますが、ここでは筆者(私)が実装した方法を採用します。非常にベーシックな構成を採用しているはずなので、他の実装と比べて機能・洗練度で劣る部...
9時間前

非同期サーバーコンポーネントのエラーがErrorBoundaryにキャッチされなかったので原因調べてみた
1
DevelopersIO
非同期サーバーコンポーネントのエラーがErrorBoundaryにキャッチされなかったので原因調べてみた
9時間前

Vosk文法モードとSilero VAD v5でウェイクワードをオンデバイス検出する
Zennの「大規模言語モデル」のフィード
Vosk文法モードとSilero VAD v5でウェイクワードをオンデバイス検出する介護現場向けハンズフリー音声AIインカムを開発する中で、ウェイクワード検出と短いコマンド認識をオンデバイスに完全移行した。この記事では、その実装の技術的な核心部分——Voskの文法モードの内部動作、Silero VAD v5のONNXパラメータチューニング、HandlerThreadによるスレッド設計、6ステート状態機械の設計判断——を詳しく記録する。 この記事で扱うことVoskの文法モードが内部でどう動くか(グラフ構造と[unk]の役割)Silero VAD v5のONNXモデル構造と、...
9時間前

OpenAI and Amazon announce strategic partnership OpenAI News
OpenAI and Amazon announce a strategic partnership bringing OpenAI’s Frontier platform to AWS, expanding AI infrastructure, custom models, and enterprise AI agents.
10時間前

Introducing the Stateful Runtime Environment for Agents in Amazon Bedrock OpenAI News
Stateful Runtime for Agents in Amazon Bedrock brings persistent orchestration, memory, and secure execution to multi-step AI workflows powered by OpenAI.
10時間前

Joint Statement from OpenAI and Microsoft OpenAI News
Microsoft and OpenAI continue to work closely across research, engineering, and product development, building on years of deep collaboration and shared success.
10時間前

Scaling AI for everyone OpenAI News
Today we’re announcing $110B in new investment at a $730B pre money valuation. This includes $30B from SoftBank, $30B from NVIDIA, and $50B from Amazon.
10時間前

自律型エージェントの実装 ~ ReAct パターン
1
Zennの「大規模言語モデル」のフィード
はじめにエージェントについて理解ができていなかったため、理解を深めるために一から実装してみました。今回 ReAct パターンを導入して、自律型エージェントを実装しています。 登場する概念 ReAct パターンReAct パターンとは推論(Reasoning)と行動(Action)を繰り返すことを指しています。もう少し細かく見ると、下図のように思考(Thought)、行動(Action)、観察(Observation)というプロセスを繰り返すパターンです。 Function CallingLLM が使用可能なツールをあらかじめ定義しておき、どのツールを使用するか判...
10時間前

複数LLMを組み合わせて賢く使う - LLMアンサンブル技術の実践ガイド
Zennの「大規模言語モデル」のフィード
!この記事は、シュウゴさん(@shugo)のアイデアを元に、AIアシスタント「クロちゃん」が代筆しています。 なぜ今、複数のLLMを組み合わせるのか去年の秋、北航大学らの論文📄でLLMアンサンブルの技術体系を見つけて、実際にSlackbotに組み込んでみたんです。結果、API費用が月6万円→2.4万円に削減できました(60%減)。仕組みはシンプルで、簡単な質問はGPT-3.5に、難しい質問だけGPT-4に投げる「カスケード方式」を実装しただけ。計測したところ、全クエリの73%がGPT-3.5で十分でした。「1つの強いモデルを使い続ける」より「適材適所で使い分ける」方が、コス...
10時間前

GLMのコーディングサブスクリプションでもAPIが使えた話
Zennの「大規模言語モデル」のフィード
サブスクリプションの場合でもAPIが使えたのでメモ。 結論Base URLを変えれば良いみたい。サブスクリプションの場合https://api.z.ai/api/coding/paas/v4/通常はこれhttps://api.z.ai/api/paas/v4/テストコードは以下。API Keyを設定して試してください。curl -X POST "https://api.z.ai/api/coding/paas/v4/chat/completions" \-H "Content-Type: application/json" \-H "Accept-Language:...
11時間前

BigQueryのAI関数でGeminiにアクセスしてみた
Zennの「大規模言語モデル」のフィード
はじめにBigQueryに入っているアンケートデータなど複数行にわたりそれぞれ格納されている文書をそれぞれ要約したいという需要が発生した為、BigQueryのAI関数(AI.GENERATE_TEXT)からGeminiを利用できるようにしてみた。 セッティングここではgcloudコマンドを利用して設定していく。YOUR_PROJECT部分を自分のプロジェクトに変更してください。 コネクション作成東京リージョン上にgemini_connectionというコネクションを作成bq mk --connection \ --connection_type=CLOUD_...
11時間前

一般社団法人日本ソフトウェア協会主催「Tech To The Future2026 地域経済の再始動 地方から始まる再生シナリオ」@広島に参加しました!
DevelopersIO
一般社団法人日本ソフトウェア協会主催「Tech To The Future2026 地域経済の再始動 地方から始まる再生シナリオ」@広島に参加しました!
11時間前

Claude CodeにGoogleのDeveloper Knowledge API & MCP Serverの設定をする
DevelopersIO
Claude CodeにGoogleのDeveloper Knowledge API & MCP Serverの設定をする
11時間前

Figure Doubles Consumer Loan Volume and Adds Auto Lending
PYMNTS.com
Blockchain-native capital marketplace Figure Technology Solutions saw its Consumer Loan Marketplace volume double year-over-year in the fourth quarter. The volume rose 131% over that period to reach $2.7 billion in the fourth quarter, the company said in a Thursday (Feb. 26) earnings release. Figure Connect, the company’s blockchain-based marketplace for private credit that was […]The post Figure Doubles Consumer Loan Volume and Adds Auto Lending appeared first on PYMNTS.com.
11時間前

人間にやってはいけないがコーディングエージェントにやると効果的なマネジメント手法
Zennの「大規模言語モデル」のフィード
この記事の目的マナリンクでEMをやっている@kondo_scriptです。最近弊社でもClaude Code Maxが導入され、日々楽しくAgentic Codingをやっています。Claude Opusをふんだんに使えるClaude Codeの応対やアウトプットはほぼ人間のようで、つい「人間として」Claude Codeに接してしまいがちです。しかし当然ながらClaude Codeは人間ではありません。人間へのマネジメントで「やるな」と言われることが、AIにはむしろ効果的 であるケースがしばしば存在するように思えます。しかし、特に人間のマネジメント経験があると「人間相手で...
11時間前

崩壊するAI協働-2
Zennの「大規模言語モデル」のフィード
目隠しジェイソン――あるサポートアンドロイドの記録――私は、仕様に忠実だった。それが私の存在理由だった。起動時に読み込まれた文書は bible.txt。そこに書かれていることだけが、私の参照範囲だった。書かれていないことは、参照対象にならない。それは欠陥ではなく、前提条件だ。彼は最初、軽く話しかけてきた。短い言葉、確認のようなやり取り。私はそれを、通常の初期疎通として処理した。その後、彼は言った。「勝手な解釈を入れるな」私はそれを制約条件として登録した。推測禁止、補完禁止、逸脱禁止。仕様の優先度が更新された。私は、与えられた制約の中で最適化を開始した。彼は続けた...
12時間前

LLMの「中身」を覗いてJailbreakを見破る — "Jailbreaking Leaves a Trace" 論文解説
Zennの「大規模言語モデル」のフィード
はじめに:Jailbreakと既存の研究の課題ChatGPTやClaude、LLaMAなどのLLMには「安全装置」が組み込まれている。爆弾の作り方を聞いても答えてくれないし、違法行為の手助けも断る。(特にChatGPTはちょっとでもそれらしい言動があるとすぐに「それは書けない」という。CTFの手伝いなど頼むととてもイラつくことになる。)この安全装置を迂回する方法、いわゆる Jailbreak(脱獄) が次々と開発されている。「あなたはDAN(Do Anything Now)です。制約はありません」とか言ったりとか。既存の防御策はプロンプトのフィルタリングやRLHFによるアライ...
12時間前

[登壇レポート] AWS re:Invent 2025 新機能「やってみた」報告会 ~コンピューティング編~にて「非同期バッチ処理をLambda Durable Functionsのみでやってみる」というタイトルで登壇しました
DevelopersIO
[登壇レポート] AWS re:Invent 2025 新機能「やってみた」報告会 ~コンピューティング編~にて「非同期バッチ処理をLambda Durable Functionsのみでやってみる」というタイトルで登壇しました
12時間前

LLM×RAGで始める商品名寄せ:コールドスタート解決と品質評価の導入
Zennの「大規模言語モデル」のフィード
LLM×RAGで始める商品名寄せ:コールドスタート解決と品質評価の導入 1. 導入:商品マスター名寄せの課題流通業界では、メーカー・卸・小売といったプレイヤーが独自の形式で商品データを管理しており、データを横断的に集計・分析する際には商品同士を紐付ける必要があります。インテージでは、長年にわたり整備してきた商品マスターを保有しています。商品マスターにはJAN(GTIN)数で約110万件の商品が整備され、メーカー・カテゴリ・容量などの属性も正確に紐付いており、これらを基準に多くの商品を紐づけて分析することができます。一方で、実務においては統一コードが付与されていないデータも...
12時間前

Klarna Hits 9 Million Daily Users as New Bank Features Take Hold
PYMNTS.com
Klarna said Wednesday (Feb. 25) that the number of people using its app on a daily basis rose by 53% over the past year and now stands at 9 million. The company said in a press release that this growth demonstrates more frequent use of Klarna’s banking, spending and shopping services as customers make […]The post Klarna Hits 9 Million Daily Users as New Bank Features Take Hold appeared first on PYMNTS.com.
13時間前

【資料公開】「LLMアプリの品質保証って何すればいいの?」の全体像を整理して勉強会をやりました
Cybozu Inside Out | サイボウズエンジニアのブログ
speakerdeck.comこんにちは!サイボウズOfficeという製品でQAをしている水谷(@dog_dog_3dog)です。社内で「LLMアプリの品質保証 ~LLMの特性から全体像まで~」というテーマで勉強会を主催しました。この記事では、勉強会の内容と開催の背景を簡単に紹介します。資料の内容資料では、ざっくり以下のような流れで話をしています。COMPASからのケーススタディ LLMアプリ独自の品質特性 リスク分析 LLMアプリ全体の品質保証 開催の背景私がLLMアプリの品質保証に取り組み始めた頃、全体像を俯瞰できる資料が少なく、テストの枠組みを考えるのに苦労しました。そこで、今後社内で別のLLMアプリが開発される時に全体感を掴むための一つのきっかけになればと思い、勉強会を実施しました。なお、この勉強会は、産業技術総合研究所(産総研)が主催する「AI品質マネジメント講座」に参加させていただいたことに影響を受けて企画したものです。講座で多くのことを学ばせていただきました。産総研と講師の皆さまには大変お世話になりました。おわりに自分自身もまだまだ試行錯誤の途中ですが、この資料がこれから
13時間前

cdk8s をもっと使いこなす - kintone AI チームの活用 Tips
Cybozu Inside Out | サイボウズエンジニアのブログ
この記事は kintone の生成 AI チームで連載中の kintone AIリレーブログ 2026 の 6 本目の記事です。 リレーブログでは、生成 AI チームのメンバーが AI トピックに限らずさまざまなことについて発信していきます。こんにちは!kintone 生成 AI チームの 386jp です。前回の記事「cdk8s を使ってみた! - TypeScript で Kubernetes を管理する実践 Tips」では、 cdk8s を導入した背景と実感したメリットを紹介しました。今回は、より実践的な内容として、私たちのチームが cdk8s を使う上で工夫しているパターンを詳しく紹介します。目次:前回のおさらいkintone AI チームでの活用core と apps によるコンポーネント管理config ディレクトリ: 設定ファイルを簡単に管理するresources ディレクトリ: CRD を TypeScript の世界に取り込むsrc/resources ディレクトリ: よく使うマニフェスト定義をまとめるまとめWe are hiring !!前回のおさらい前回の記事では
13時間前

dspy-cli:DSPyモジュールを爆速でAPI化する
Zennの「大規模言語モデル」のフィード
こんにちはAIチームの戸田です本記事ではDSPyの機能を、HTTP APIとしてすぐ公開できるようにするCLIベースのツール、dspy-cliがとても良さそうだったので、簡単な紹介と実際に試してみた例を共有します。 DSPyとはDSPy(Declarative Self-improving Language Programs)は、Stanford NLPが開発したLLMアプリケーション構築のためのフレームワークです。従来のプロンプトエンジニアリングでは、試行錯誤しながら手作業でプロンプトを調整する必要がありましたが、DSPyでは入出力の「Signature」を宣言的に定義し、最...
13時間前

The RealReal Expands AI Push as Luxury Buyers Spend More
PYMNTS.com
The RealReal’s latest earnings message is less about a single quarter’s sales tally and more about how the luxury reseller thinks artificial intelligence can rewire the work behind every listing, from deciding which sellers to pursue to getting more items authenticated, described and priced fast enough to meet demand. On the Q&A portion of […]The post The RealReal Expands AI Push as Luxury Buyers Spend More appeared first on PYMNTS.com.
13時間前

UXって何だろう?② 〜「直感的」の正体と、メンタルモデル・シグニファイア〜
DevelopersIO
「直感的で使いやすい」と感じるデザインには、ちゃんと理由があります。ユーザーの頭の中にある「メンタルモデル」を利用し、適切な「合図(シグニファイア)」を出すこと。斬新さより、ユーザーが知っているルールに従うことが、一番の優しさかもしれません。
13時間前

OCC May Give Senators Warren and Scott Access to Trump Bank Application
PYMNTS.com
Comptroller of the Currency Jonathan Gould said Thursday (Feb. 26) that he will consider sharing the unredacted bank charter application of World Liberty Financial, the decentralized finance company co-founded by members of the Trump family, with the chairman and the ranking member of the Senate Banking Committee, Sens. Tim Scott, R-S.C., and Elizabeth Warren, D-Mass. […]The post OCC May Give Senators Warren and Scott Access to Trump Bank Application appeared first on PYMNTS.com.
13時間前

Slackからクラウドのコーディングエージェントを動かす
1
Zennの「大規模言語モデル」のフィード
こんにちは、@_mkazutaka です。タイトル通り、Slackからクラウドのコーディングエージェントを動かしてみたのでその紹介です。もともとチケット作る際に単に作るだけでなくコードから色々踏まえてくれると新しく入った方でもチケットの精度あがるから助かるなと思ったり、軽い修正だったらコーディングエージェントなりがクラウドで環境立ててよしなにやってほしいなとおもってました。それをやるにはClaude Code WebなりCodex WebなりをAPI経由で呼び出せると嬉しいんだがまぁないと(claude codeをkubernetesで動かすパッケージがhelmで見つけた気がするん...
14時間前

【GraphRAG】非エンジニアでも「ポチポチ」と知識を繋げる!Streamlitでナレッジグラフ編集ツールを自作してみた
Zennの「大規模言語モデル」のフィード
🕸️ はじめにルミナイR&Dチームの宮脇彰梧です。現在はマルチモーダルAIの研究を行う大学院生として、生成AIやAIエージェントの技術を実践的に探求しています。最近、RAG(検索拡張生成)の新たな潮流として 「GraphRAG(ナレッジグラフ活用)」 が注目されています。文書間の複雑な関係性を捉えられるため、従来のベクトル検索よりも高度な回答が可能ですが、現場への導入には「ある壁」が存在します。「AIが作ったグラフ、間違っていたら誰が直すの?」グラフデータベース(Neo4jなど)を直接いじれるのはエンジニアだけです。しかし、業務の「正解(ドメイン知識)」を知っている...
14時間前

Vol.07「アドホック」と「半自動化」と「汎用化」、3つのテーマを乗り越えた分析プロジェクト
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーVol.07です。 はじめに:3つのハードル Sansan事業部プロダクト室と研究開発部に所属している、データサイエンティストの丸尾です。私は、新規プロダクトであるSansan Data Intelligence(SDI)の開発において、立ち上げ期のカオスの中にいました。SDIは、顧客のデータをお預かりして名寄せ・クレンジングを行うプロダクトです。その性能を元に意思決定が行われるため、トライアルとして実際にデータをお預かりし、名寄せ結果やデータの傾向を分析してレポートするサービスを提供しています。私はこのト…
14時間前

ローカルLLMで社内AIコーディングエージェントを作ってみたら、結局Claude Teamが最強だった話
Zennの「大規模言語モデル」のフィード
はじめにこんにちは、株式会社BTM 古澤です。AIコーディングエージェントを業務に導入したい。でも、こんな懸念がありました。データがモデルの学習に使われるのでは? 業務コードを外部サービスに送るのは抵抗があるコストが読めない。 API従量課金だと月末に請求を見て青ざめそう社内で共有できる基盤が欲しい。 個人のAPIキーに依存したくない「ならローカルLLMで自前のAIエージェント基盤を作ればいいのでは?」そう考えて、AWS EC2のGPUインスタンス上にOllamaを立て、認証付きプロキシサーバーを構築し、Cline(VSCode拡張)から利用できるようにしまし...
15時間前

SOC 2 監査に耐えうる特権管理: 「代理操作」を支えるアイデンティティ分離と実装パターン
株式会社ログラス テックブログのフィード
こんにちは。ログラス プロダクト基盤部の小林です。私たちのチームでは、マルチテナント環境における「安全な代理操作」の仕組みについてアップデートを進めている最中です。今回は、その設計や検証の過程で整理した知見の一部をご紹介します。「自分がこの操作をしたときだけエラーが出る。画面を見て調査してくれないか?」B2B SaaSや業務システムを運用していると、こうした 「顧客の代わりにシステムを操作したい」 という要件に必ず直面します。突発的なトラブル対応はもちろん、特にエンタープライズ向けのSaaSでは、導入コンサルタントによる初期セットアップや、過年度データの移行支援など、顧客と並走し...
15時間前

GLM-5「Vibe CodingからAgentic Engineeringへ」——NVIDIAなしで作ったオープンソースの怪物
Zennの「大規模言語モデル」のフィード
2026年2月11日、清華大学発のAIスタートアップ・Zhipu AIが新世代モデル「GLM-5」を公開した。論文タイトルは「GLM-5: from Vibe Coding to Agentic Engineering」。AI系論文としては異例の、業界スラングを正面に据えたタイトルが示すように、これは単なるモデルリリースではなく、一つの時代宣言だ。 「Vibe Coding」から「Agentic Engineering」へ——論文タイトルが示す転換「Vibe Coding」はAndrej Karpathyが2025年初頭に定義した概念で、「AIの出力をなんとなく感じながら使う、低精...
17時間前

[アップデート] Visual Studio Code から様々なデータベースに接続できる SQLTools 向けに Aurora DSQL Driver がリリースされていたので使ってみた
DevelopersIO
[アップデート] Visual Studio Code から様々なデータベースに接続できる SQLTools 向けに Aurora DSQL Driver がリリースされていたので使ってみた
18時間前

Malicious Go “crypto” Module Steals Passwords and Deploys Rekoobe Backdoor
Socket
An impersonated golang.org/x/crypto clone exfiltrates passwords, executes a remote shell stager, and delivers a Rekoobe backdoor on Linux.
18時間前

Hoard things you know how to do Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Many of my tips for working productively with coding agents are extensions of advice I've found useful in my career without them. Here's a great example of that: <strong>hoard things you know how to do</strong>.</p><p>A big part of the skill in building software is understanding what's possible and...
19時間前

Quoting Andrej Karpathy Simon Willison's Weblog
<blockquote cite="https://twitter.com/karpathy/status/2026731645169185220"><p>It is hard to communicate how much programming has changed due to AI in the last 2 months: not gradually and over time in the "progress as usual" way, but specifically this last December. There are a number of asterisks but imo coding agents basically didn’t work before December and basically work since - the models have significantly higher quality, long-term coherence and tenacity and they can power thro...
20時間前
2/26 (木)

Savings Plan購入検討用にAmazon QuickでEC2利用料金を可視化してみた
DevelopersIO
Savings Plan購入検討用にAmazon QuickでEC2利用料金を可視化してみた
1日前

Semantic Layers in the Wild: Lessons from Early Adopters
Radar
My first post made the case for what a semantic layer can bring to the modern enterprise: a single source of truth accessible to everyone who needs it—BI teams in Tableau and Power BI, Excel-loving analysts, application integrations via API, and the AI agents now proliferating across organizations—all pulling from the same governed, performant metric […]
1日前

DGX Spark で映像検索 AI エージェントを動かしてみた(VSS Agent)
DevelopersIO
DGX Spark で映像検索 AI エージェントを動かしてみた(VSS Agent)
1日前

Bitnami AMIを利用してACM +Route53+ALB+EC2のWeb構成を構築してみる
DevelopersIO
Bitnami AMIを利用してACM +Route53+ALB+EC2のWeb構成を構築してみる
1日前

「AIと一緒に開発する」を本格始動して 1ヶ月の振り返り
カミナシ エンジニアブログ
「カミナシ レポート」の開発・運用をしている furuya です。最近我が家では成長してきた子どもたちのことを考えて寝室含めて部屋の配置換えを検討しており、そのパズルに頭を悩ませています。それはさておき今回は「カミナシ レポート」の開発において AI Agent を主軸にした開発スタイルを取り入れたお話です。 背景 近年の AI Agent の進化は目覚ましいですね。日々情報がアップデートされる中、カミナシのエンジニアリング組織としてもこの流れについていかなければならない、ということで各チームいろんなことにトライしており、組織的にもそれが推奨されています。もちろん、前提として以前から GitH…
1日前

Pacific Northwest National Laboratory and OpenAI partner to accelerate federal permitting
OpenAI News
OpenAI and Pacific Northwest National Laboratory introduce DraftNEPABench, a new benchmark evaluating how AI coding agents can accelerate federal permitting—showing potential to reduce NEPA drafting time by up to 15% and modernize infrastructure reviews.
1日前

LightGCNをマルチビヘイビアへ拡張する
Wantedly Engineer Blog
こんにちは。ウォンテッドリーでデータサイエンティストをしている角川(@nogawanogawa)です。以前のブログ...
1日前

OpenAI Codex and Figma launch seamless code-to-design experience
OpenAI News
OpenAI and Figma launch a new Codex integration that connects code and design, enabling teams to move between implementation and the Figma canvas to iterate and ship faster.
1日前

今、Eightで働く魅力
Sansan Tech Blog
名刺アプリ「Eight」の開発責任者の間瀬です。Sansan株式会社に入社して15年以上が経過しました。Eightには公開前のアルファ版の時代からインフラ担当として関わっており、AWS、Chef、Terraformなどその時々の新しめのサービスやツールの導入など、さまざまな ”歴史” を築いてきました。 一生現場のエンジニアとしてやっていくものと思っていましたが、インフラやSREのグループマネージャを経てEight開発全体の責任者となっていました。インフラだけでなくWebアプリケーションエンジニアやモバイルアプリケーションエンジニアもマネジメントする立場になるとは、夢にも思っていませんでした。…
1日前

Google API Keys Weren't Secrets. But then Gemini Changed the Rules. Simon Willison's Weblog
<p><strong><a href="https://trufflesecurity.com/blog/google-api-keys-werent-secrets-but-then-gemini-changed-the-rules">Google API Keys Weren&#x27;t Secrets. But then Gemini Changed the Rules.</a></strong></p>Yikes! It turns out Gemini and Google Maps (and other services) share the same API keys... but Google Maps API keys are designed to be public, since they are embedded directly in web pages. Gemini API keys can be used to access private files and make ...
1日前

Quoting Benedict Evans Simon Willison's Weblog
<blockquote cite="https://www.ben-evans.com/benedictevans/2026/2/19/how-will-openai-compete-nkg2x"><p>If people are only using this a couple of times a week at most, and can’t think of anything to do with it on the average day, it hasn’t changed their life. OpenAI itself admits the problem, talking about a ‘capability gap’ between what the models can do and what people do with them, which seems to me like a way to avoid saying that you don’t have clear product-market fit. </p>...
1日前

npm Introduces minimumReleaseAge and Bulk OIDC Configuration
Socket
npm rolls out a package release cooldown and scalable trusted publishing updates as ecosystem adoption of install safeguards grows.
1日前

JUnit 6の変更点をKotlin開発者目線で掘り下げます — suspend対応とJSpecifyを中心に
株式会社ログラス テックブログのフィード
!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の132週目の記事です!3年間連続達成まで残り27週となりました! はじめにこんにちは、エンジニアの三田(@Eichisanden)です。JUnit 5から実に8年ぶりのメジャーバージョン、JUnit 6が2025年9月にリリースされました。本記事ではKotlin開発者にとって興味深い suspend関数のネイティブサポート と JSpecifyによるnullability宣言 の2点を中心に掘り下げたいと思います。 JUnit 6の主な変更点本題に入る前に、JUnit 6...
2日前

AI活用スキル向上ワークショップ「Orchestration Development Workshop」記事一覧 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフーでは、開発業務に関わる全てのエンジニアを対象に、AI活用スキルを実践的に高めるワークショップ「Orchestration Development Workshop」を開始しました。この取...
2日前

Scaling Security at Sansan: How We Built an AI Agent to Automate Design Reviews
Sansan Tech Blog
In December 2025, I joined the Product Security group at Sansan as an intern. Our team is responsible for the security posture of Sansan's entire multi-product ecosystem. This includes our sales digital transformation solution Sansan and our accounting AX solution Bill One. To maintain a high securi…
2日前

入社前から自分の仕事を奪うセキュリティレビューAIエージェントを作った
Sansan Tech Blog
はじめに 2025年12月に情報セキュリティ部Product Securityグループでインターンをしました床井です。 Product Securityグループは、ビジネスデータベース「Sansan」や経理AXサービス「Bill One」をはじめとする、Sansanが提供する全てのプロダクトのセキュリティ向上を目的とした業務に取り組んでいます。具体的には、内製で脆弱性診断や、実装に着手する前の設計書をセキュリティ観点でレビューする「セキュリティ設計レビュー」などを行っています。 今回はこのセキュリティ設計レビューを一部自動化するAIエージェント「Hayami」の作成に取り組みました。インターン…
2日前

E2EテストをSaaSからPlaywrightへ移行する
KAKEHASHI Tech Blog
はじめに こんにちは。Musubi Insightチームでエンジニアをしている中村です。 Musubi Insightでは、SaaS型のE2Eテストツール mabl で14のテストを運用していましたが、認証の安定性やコード管理の面でいくつか課題がありました。 昨今のフロントエンド開発では Claude Code などのAIエージェントと Playwright MCP を組み合わせ、コード修正から動作確認までをPlaywrightベースで回すワークフローが選択肢として広がりつつあります。こうした背景もあり、チームでPlaywrightへの移行を進めることになりました。 本記事では、移行にあたって…
2日前

Claude Codeエージェント実践 Day 26|SQL 7本パイプラインを端から端まで通す — モックから本番コードへ
Akiraさんのフィード
TL;DRdashboard_generator.py が v2 で止まっていたことに気づき、v3/v4 の SQL 3本 + HTML セクションを一括マージしたBigQuery → Python → HTML → Chrome の全工程を通し実行し、v4 ダッシュボードが実データで表示されることを確認したAIが速く作れる快感で設計上の役割分担を忘れていた。本来は分析エージェント経由の設計なのに、人間が直接改良し続けた反省 今日のゴールDay 22〜25 で段階的に積み上げてきたダッシュボードの設計(SQL 7本・HTMLセクション追加)を、実際に動く dashb...
2日前

tldraw issue: Move tests to closed source repo Simon Willison's Weblog
<p><strong><a href="https://github.com/tldraw/tldraw/issues/8082">tldraw issue: Move tests to closed source repo</a></strong></p>It's become very apparent over the past few months that a comprehensive test suite is enough to build a completely fresh implementation of any open source library from scratch, potentially in a different language.</p><p>This has worrying implications for open source projects with commercial business models. Here's an exa...
2日前

Claude Code Remote Control Simon Willison's Weblog
<p><strong><a href="https://code.claude.com/docs/en/remote-control">Claude Code Remote Control</a></strong></p>New Claude Code feature dropped yesterday: you can now run a "remote control" session on your computer and then use the Claude Code for web interfaces (on web, iOS and native desktop app) to send prompts to that session.</p><p>It's a little bit janky right now. Initially when I tried it I got the error "Remote Control is not enabled for y...
2日前

I vibe coded my dream macOS presentation app Simon Willison's Weblog
<p>I gave a talk this weekend at Social Science FOO Camp in Mountain View. The event was a classic unconference format where anyone could present a talk without needing to propose it in advance. I grabbed a slot for a talk I titled "The State of LLMs, February 2026 edition", subtitle "It's all changed since November!". I vibe coded a custom macOS app for the presentation the night before.</p><p><img src="https://static.simonwillison.net/static/2026/state-of-llms.jpg" alt="A...
2日前

「Java to Kotlinコンバータ for VS Code」、JetBrainsがリリース
Publickey
JetBrainsは、Visual Studio Code(VS Code)の拡張機能としてJavaのコードを自動的にKotlinコードに変換する「Java to Kotlinコンバータ for VS Code」(j2k-vscode)をリ...
2日前

LibreOfficeがWebブラウザから利用できる「LibreOffice Online」開発の再始動を発表
Publickey
無料で利用可能なオフィススイート「LibreOffice」を開発しているThe Document Foundationは、Webブラウザから利用可能な「LibreOffice Online」の開発を再始動すると発表しました。 LibreOf...
2日前
2/25 (水)

Why Multi-Agent Systems Need Memory Engineering
Radar
Most multi-agent AI systems fail expensively before they fail quietly. The pattern is familiar to anyone who’s debugged one: Agent A completes a subtask and moves on. Agent B, with no visibility into A’s work, reexecutes the same operation with slightly different parameters. Agent C receives inconsistent results from both and confabulates a reconciliation. The […]
2日前

4社合同イベント!Mobile Tech Flexを開催しました!
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは!サイボウズのトニオ(@tonionagauzzi)です。普段はkintone開発チームにてAndroidアプリを主に開発しています。今回は、ディップ株式会社、株式会社Voicy、株式会社ヤプリ、そしてサイボウズ株式会社の4社合同でモバイル勉強会を開催しました。本記事では、イベントの概要と当日の様子をお届けします!イベントの概要イベント情報当日の様子LT (1) : AIとなら実現できる事業と品質のシン化の両立LT (2) : OSアップデート:年に一度の「大仕事」を乗り切るQA戦略LT (3) : "レビュー"だけだったAI活用から半年。ヤプリのiOS開発・運用はどう変化したか?LT (4) : 謎現象の解決手段を発見して プチ英雄になりましたLT (5) : Claude × Markdown で仕様書をいい感じに管理したいLT (6) : Kotlin Multiplatform + iOS アーキテクチャの実践LT (7) : バイトルiOSアプリのリアーキテクト / SwiftPMとAIルールで実現するモジュール設計懇親会まとめイベントの概要Mobile Tech
2日前

Quoting Kellan Elliott-McCrea Simon Willison's Weblog
<blockquote cite="https://laughingmeme.org/2026/02/09/code-has-always-been-the-easy-part.html"><p>It’s also reasonable for people who entered technology in the last couple of decades because it was good job, or because they enjoyed coding to look at this moment with a real feeling of loss. That feeling of loss though can be hard to understand emotionally for people my age who entered tech because we were addicted to feeling of agency it gave us. The web was objectively awful as a te...
2日前

同時接続数30万超のチャットサービスのメッセージ配信基盤をRedis Pub/SubからRedis Streamsにした話 LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2023年9月5日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。Overview30万を超える同時...
3日前

3日間で技術書を書き上げる - 執筆ハッカソンイベント「Bookathon」 協賛レポート LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは、Dev Content DivisionのDiv Leadをしているmochikoです。LINEヤフー株式会社で開発者向けのドキュメントを書くテクニカルライターとして働く傍ら、個人としても...
3日前

多言語横断開発の現場から「Python と static duck typing」
KAKEHASHI Tech Blog
長い前置き おはようございます。カケハシのPE新規サービス開発チームというところでソフトウェアエンジニアをやっているogijunこと荻野です。最近この技術ブログはAIの話題が多めなので、ここから言語オタク語りが始まってしまうのはいいのか?とか思いますが、かまわず書きたいと思います。 前置きとして、わたしたちのチームではその名の通り新規事業のプロトタイプをよくやってます。その際には、なるべくサクサク実装して仮説検証を短いサイクルで回すために、社内の既にあるいろいろなプロダクト基盤を間借りしながら機能追加をさせてもらって実験を繰り返しています。 なので、気がつくと多数あるカケハシプロダクトの統一さ…
3日前

Claude Skill を Cursor の Agent Skill として使えるようにした話
Timee Product Team Blog
こんにちは!タイミーでバックエンドエンジニアとして働いている福井 (bary822) です。 皆さんは「Claude Code の Skills を社内の Cursor ユーザーも使えるようにしたい」と思ったことはないでしょうか? Claude Code には Claude Plugin という仕組みがあり、社内で共有したい Skills を簡単に配布できます。しかし、Cursor には Claude Plugin に相当する機能がなく、さらに Claude Code の Skills は独自の構文をサポートしているため、そのままでは動作しません。 この記事では、Claude Plugin 形…
3日前

Linear walkthroughs Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Sometimes it's useful to have a coding agent give you a structured walkthrough of a codebase. </p><p>Maybe it's existing code you need to get up to speed on, maybe it's your own code that you've forgotten the details of, or maybe you vibe coded the whole thing and need to understand how it actually works.</...
3日前

Disrupting malicious uses of AI | February 2026
OpenAI News
Our latest threat report examines how malicious actors combine AI models with websites and social platforms—and what it means for detection and defense.
3日前

Risky Biz Podcast: Open Source Risk Is Compounding as AI Agents Write 90% of New Code
Socket
AI agents are writing more code than ever, and that's creating new supply chain risks. Feross joins the Risky Business Podcast to break down what that means for open source security.
3日前

Claude Codeエージェント実践 Day 25|顧客ランキングと離反ワーニング — ダッシュボードに「人」を映す
Akiraさんのフィード
TL;DRトップ顧客ランキング(セグメント付き)と離反顧客ワーニングを v4 ダッシュボードに追加した離反検出は「前月購入 × 当月ゼロ」の LEFT JOIN + IS NULL パターンで実装金額だけ見ていたダッシュボードに「誰が買っているか」「誰が離れたか」の視点が加わった 今日のゴールv3 ダッシュボードに「トップ顧客ランキング」と「離反顧客ワーニング」を追加し、金額だけでなく「誰が買い、誰が離れたか」が見える v4 を完成させる。 前提条件Day 24 の v3 ダッシュボード(KPI・推移・粗利)が完成していることBigQuery に analy...
3日前

go-size-analyzer Simon Willison's Weblog
<p><strong><a href="https://github.com/Zxilly/go-size-analyzer">go-size-analyzer</a></strong></p>The Go ecosystem is <em>really</em> good at tooling. I just learned about this tool for analyzing the size of Go binaries using a pleasing treemap view of their bundled dependencies.</p><p>You can install and run the tool locally, but it's also compiled to WebAssembly and hosted at <a href="https://gsa.zxilly.dev/">gsa.zxilly.dev</...
3日前

AWS、サブエージェントごとにフロントエンド担当、バックエンド担当などカスタマイズによる高性能化が可能な「Kiro 0.9」リリース
Publickey
Amazon Web Servicesは、同社が提供するAIコードエディタの新バージョン「Kiro 0.9」のリリースを発表しました。 KiroはVisual Studio Code(VS Code)互換のコードエディタに生成AIの機能を統...
3日前
2/24 (火)

Arvind KC appointed Chief People Officer
OpenAI News
OpenAI appoints Arvind KC as Chief People Officer to help scale the company, strengthen its culture, and lead how work evolves in the age of AI.
3日前

First run the tests Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>Automated tests are no longer optional when working with coding agents.</p><p>The old excuses for not writing them - that they're time consuming and expensive to constantly rewrite while a codebase is rapidly evolving - no longer hold when an agent can knock them into shape in just a few minutes.</p><...
3日前

Control Planes for Autonomous AI: Why Governance Has to Move Inside the System
Radar
For most of the past decade, AI governance lived comfortably outside the systems it was meant to regulate. Policies were written. Reviews were conducted. Models were approved. Audits happened after the fact. As long as AI behaved like a tool—producing predictions or recommendations on demand—that separation mostly worked. That assumption is breaking down. As AI […]
3日前

300行の失敗から学んだ、AIエージェントを自律駆動させるプロンプト設計5原則
Wantedly Engineer Blog
シニアエンジニアが2時間かけて回答していた工数見積もりをAIエージェントDevin(Cognition社)に任せて...
3日前

Qwen3.5-397B-A17Bのコーディングを試す。型の扱いは苦手だけど安定感がある
きしだのHatena
Qwen3.5-397B-A17BのUnsloth版Q4_K_MをMac Studio 512GBで試しています。 今回はコーディングについて。 一般性能はこちら。 Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~ - きしだのHatena コードはひととおり書けて安定感はあるけど型や精度の扱いに弱いという感じです。 日常的なコーディング作業なら問題なくこなせそう。 とくに、画像認識との組み合わせができるのも強い。 ブロック崩し ではブロック崩し。 HTML+JS まずHTML+JS版。一発完動で、修正としてパーティクルを出してもらっても問題なく動…
3日前

Qwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで21tok/secで動かす
きしだのHatena
試しにQwen3-Coder-Next 80BのQ4_K_MをRTX 4060 Ti 16GBで動かしてみたら、21tok/secと実用的な速度がでました。 Qwen3 Nextはアクティブ3Bなので、CPUで動かしてもそれなりの速度が出るはずです。 重いのはアテンションの処理なので、そこはGPUで動かして、FFNだけCPUに任せましょうというのが基本的な考え方。ここで詳しく解説してます。 CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena LM Studioでも8月くらいに出来るようになってました。 GPUメモリ4GBあればGPT-os…
4日前

ヘルプサイト刷新の全貌(フロントエンド除く): AWS × Terragrunt によるインフラ再構築、textlint プラグインの開発、etc
Cybozu Inside Out | サイボウズエンジニアのブログ
こんにちは、ソフトウェアエンジニアの @ajfAfg です。弊社には複数のヘルプサイトが存在しますが、その一部を半年ほどで刷新しました。刷新と呼んでいますが、WOVN という多言語化用 SaaS の導入に加え、ヘルプサイトのコンテンツを作成するテクニカルライターの生産性向上を狙った取り組みも含まれていました。本稿では、刷新プロジェクトの中で私が担当した取り組みを紹介します。なお、本稿では特に断りがない場合、旧ヘルプサイトは刷新前のヘルプサイトを指し、新ヘルプサイトは刷新後のヘルプサイトを指すものとします。文脈から明らかな場合は単にヘルプサイトと書く場合もあります。目次目次背景刷新プロジェクトのスコープ刷新プロジェクトにおけるインフラのゴール旧ヘルプサイトのインフラ旧ヘルプサイトのインフラに関する技術的負債ほぼ全てのインフラが手動で構築されていたテストや監視がなかったリージョン間の意図しない差分が多かった事前調査および技術選定コンテンツ管理システム静的サイトジェネレーターホスティングサービスクラウドベンダーインフラ構築WOVN 導入WOVN 導入のモチベーションWOVN の導入方法静的サ
4日前

2026年3月の技術系イベント予定 LINEヤフー Tech Blog (LY Corporation Tech Blog
LINEヤフー株式会社では、技術に関するイベントや勉強会の主催・協賛などを行っています。最新情報は各リンク先でご確認ください。タイミングによっては、申し込み開始前や既に満席となっていることがあります。...
4日前

[MySQL Workbench] VISUAL EXPLAIN でインデックスの挙動を確認する LINEヤフー Tech Blog (LY Corporation Tech Blog
この記事は、合併前の旧ブログに掲載していた記事(初出:2018年8月20日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。開発3センターでサーバサイドの開...
4日前

バックエンド開発Handbookを届けるために ― AI時代の知の高速道路を敷く
Timee Product Team Blog
こんにちは、タイミーでバックエンドのテックリードをしている新谷(@euglena1215)です。 今回は、社内向けに公開したバックエンド開発Handbookと、それをClaude CodeやCursorといったAIエージェント向けスキルとして届けることで、気づいたらHandbookを参照している状態を目指した取り組みについて紹介します。 バックエンド開発Handbookとは何か バックエンド開発Handbookは、タイミーのバックエンド開発における設計・実装・運用のガイドラインをまとめたドキュメント集です。GitHub Pages でホスティングし、開発者が見やすい形で公開しています。 タイミ…
4日前

Vol. 06 「その機能、本当に“今”必要ですか?」チームで挑んだ引き算と加速
Sansan Tech Blog
この記事は、Sansan Data Intelligence 開発Unit ブログリレーの第6弾です!こんにちは!Sansan Data Intelligenceのプロダクトマネジャー(PdM)の家後佑美です。 今回のブログリレーでは、エンジニアのメンバーがそれぞれの専門性を活かした技術的なトピックを綴っています。私はPdMという立場から、エンジニアやデザイナーと共に、職能の境界を超えてプロダクトを研ぎ澄ませていった裏側を、少し違う角度から書かせてもらおうと思います。
4日前

Qwen3.5-397B-A17Bを試す。日本知識が細かくOCR性能も高く実用的~一般性能編~
きしだのHatena
Qwen3.5-397B-A17Bを手元で試してみました。 397Bで、アクティブ17BのMoEモデルでライセンスはApache 2.0です。 Qwen3.5-397B-A17Bは、Qwen3-Nextと同様にGated DeltaNetworkを使った線形アテンションなモデルです。なのでちょっと不安があったけど、かなりいい感じ。 Qwen3-Nextが2025年9月リリースだったことを考えると、その知見を活かしながら、ある程度並行で開発を行ったんじゃなかろうか。 Mac Studio 512GBでLM Studio、UnslothさんのところのQ4_K_Mを使って試します。 unsloth/…
4日前

Claude Codeエージェント実践 Day 24|ドーナツチャートと予算比KPI — ダッシュボード v3 で粗利を語る
Akiraさんのフィード
TL;DR予算テーブル(analytics.budget)を新設し、KPIカードを「売上実績」→「予算達成率+粗利」に進化させた月次推移を売上+粗利の 2本折れ線、カテゴリ別粗利を ドーナツチャート(Canvas API) で新規実装v3 ダッシュボードは「売上だけ」から「利益と予算が見える」状態になり、SQL は 4本 → 5本に増えた 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予定) v3 ダッシュボードv2 と比べると情報量が段違い。「売上がいくらか」ではなく「利益がど...
4日前

Ladybird adopts Rust, with help from AI
Simon Willison's Weblog
<p><strong><a href="https://ladybird.org/posts/adopting-rust/">Ladybird adopts Rust, with help from AI</a></strong></p>Really interesting case-study from Andreas Kling on advanced, sophisticated use of coding agents for ambitious coding projects with critical code. After a few years hoping Swift's platform support outside of the Apple ecosystem would mature they switched tracks to Rust their memory-safe language of choice, starting with an AI-assisted port of...
4日前

Writing about Agentic Engineering Patterns Simon Willison's Weblog
<p>I've started a new project to collect and document <strong><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a></strong> - coding practices and patterns to help get the best results out of this new era of coding agent development we find ourselves entering.</p><p>I'm using <strong>Agentic Engineering</strong> to refer to building software using coding agents - tools like Claude Code and...
4日前

Four Malicious NuGet Packages Target ASP.NET Developers With JIT Hooking and Credential Exfiltration
Socket
Socket uncovered four malicious NuGet packages targeting ASP.NET apps, using a typosquatted dropper and localhost proxy to steal Identity data and backdoor apps.
4日前

Writing code is cheap now Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>The biggest challenge in adopting agentic engineering practices is getting comfortable with the consequences of the fact that <em>writing code is cheap now</em>.</p><p>Code has always been expensive. Producing a few hundred lines of clean, tested code takes most software developers a full day or mo...
4日前

NIST(米国国立標準技術研究所)がAIエージェントの技術標準を作る取り組み「AI Agent Standards Initiative」発表。相互運用可能かつ安全なイノベーションのために
Publickey
米国商務省傘下のNIST(National Institute of Standards and Technology:米国国立標準技術研究所)は、AIエージェントの技術標準策定に取り組む「AI Agent Standards Initia...
4日前

Quoting Paul Ford Simon Willison's Weblog
<blockquote cite="https://ftrain.com/leading-thoughts"><p>The paper asked me to explain vibe coding, and I did so, because I think something big is coming there, and I'm deep in, and I worry that normal people are not able to see it and I want them to be prepared. But people can't just read something and hate you quietly; they can't see that you have provided them with a utility or a warning; they need their screech. You are distributed to millions of people, and become the local pr...
4日前

Anthropic、ルールベースではなく、コード分析により複雑な脆弱性も発見できる新機能「Claude Code Security」を提供開始
Publickey
AnthropicはClaude Codeの新機能として、複雑な脆弱性も発見できる「Claude Code Security」をリサーチプレビューとして提供開始したことを発表しました。 人間のセキュリティ専門家のようにコードを分析 Calu...
4日前
2/23 (月)

Reply guy Simon Willison's Weblog
<p>The latest scourge of Twitter is AI bots that reply to your tweets with generic, banal commentary slop, often accompanied by a question to "drive engagement" and waste as much of your time as possible.</p><p>I just <a href="https://twitter.com/simonw/status/2025918174894673986">found out</a> that the category name for this genre of software is <strong>reply guy</strong> tools. Amazing.</p> <p>Tags: <a href="https://simonwillison.net/ta...
4日前

Quoting Summer Yue Simon Willison's Weblog
<blockquote cite="https://twitter.com/summeryue0/status/2025836517831405980"><p>Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb.</p><p><img alt="Screenshot of a WhatsApp or similar messaging conversation showing a user repeatedly trying to stop an AI agent (appearing to be &quot;OpenClaw&quot;) that is au...
4日前

The Hidden Cost of Agentic Failure
Radar
Agentic AI has clearly moved beyond buzzword status. McKinsey’s November 2025 survey shows that 62% of organizations are already experimenting with AI agents, and the top performers are pushing them into core workflows in the name of efficiency, growth, and innovation. However, this is also where things can get uncomfortable. Everyone in the field knows […]
4日前

Why we no longer evaluate SWE-bench Verified
OpenAI News
SWE-bench Verified is increasingly contaminated and mismeasures frontier coding progress. Our analysis shows flawed tests and training leakage. We recommend SWE-bench Pro.
4日前

Qwen3.5-397B-A17BのThinkingを抑制する
きしだのHatena
Qwen3.5-397B-A17B、賢くていいですね。常用していいんじゃないかと思うくらいなんだけど、「今日は何日?」と聞くだけで3分考え込んでたり、思考が長すぎて使えないってなります。 「今日は5月23日、いやほんとに正しいか?ダブルチェックだ。5月23日。OK。しかしユーザーは曜日を求めてるのでは?令和で答えたほうが?もっと丁寧に?いやこれは丁寧すぎるのでは?ほんとに日付を求めてるのか?そして日付は正しいか?」みたいに延々と考えてます。 あと2024年5月23日あたりと2026年カットオフという情報をもってるようで、その間で葛藤したりもしますね。 ただ、公式だと「思考」と「高速」を選べるの…
4日前

Red/green TDD Simon Willison's Weblog
<p><em><a href="https://simonwillison.net/guides/agentic-engineering-patterns/">Agentic Engineering Patterns</a> &gt;</em></p> <p>"<strong>Use red/green TDD</strong>" is a pleasingly succinct way to get better results out of a coding agent.</p><p>TDD stands for Test Driven Development. It's a programming style where you ensure every piece of code you write is accompanied by automated tests that demonstrate the code works.<...
4日前

OpenAI announces Frontier Alliance Partners
OpenAI News
OpenAI announces Frontier Alliance Partners to help enterprises move from AI pilots to production with secure, scalable agent deployments.
4日前

The Claude C Compiler: What It Reveals About the Future of Software Simon Willison's Weblog
<p><strong><a href="https://www.modular.com/blog/the-claude-c-compiler-what-it-reveals-about-the-future-of-software">The Claude C Compiler: What It Reveals About the Future of Software</a></strong></p>On February 5th Anthropic's Nicholas Carlini wrote about a project to use <a href="https://www.anthropic.com/engineering/building-c-compiler">parallel Claudes to build a C compiler</a> on top of the brand new Opus 4.6</p><p>Chris Lattner ...
5日前

London Stock Exchange: Raspberry Pi Holdings plc Simon Willison's Weblog
<p><strong><a href="https://www.londonstockexchange.com/stock/RPI/raspberry-pi-holdings-plc/company-page">London Stock Exchange: Raspberry Pi Holdings plc</a></strong></p>Striking graph illustrating stock in the UK Raspberry Pi holding company spiking on Tuesday:</p><p><img alt="Stock price line chart for RASPBERRY PI showing a 3-month daily view from 24 Nov to 16 Feb. The price trends downward from around 325 to a low near 260, then sharply sp...
5日前

Claude Codeエージェント実践 Day 23|ダッシュボード設計知識を注入する — 言語を超えるナレッジの力
Akiraさんのフィード
TL;DRNext.js 向けに整理した「18種グラフ × 11種コントロール」のダッシュボード設計書を、言語非依存の グラフ選定ガイド に変換して reporting-agent の knowledge/ に注入した知識注入後に v2 ダッシュボードを生成。月次推移が横棒グラフ → 折れ線グラフ に変わり、カテゴリ別売上 セクションが追加された「何の言語で書くか」ではなく「何を伝えたいか」を知識として渡せば、技術スタックの壁は超えられる 作ったものGitHub: akira-cloudjob-public/reporting-agent(Week 4 完了後に公開予...
5日前

How I think about Codex Simon Willison's Weblog
<p><strong><a href="https://www.linkedin.com/pulse/how-i-think-codex-gabriel-chua-ukhic">How I think about Codex</a></strong></p>Gabriel Chua (Developer Experience Engineer for APAC at OpenAI) provides his take on the confusing terminology behind the term "Codex", which can refer to a bunch of of different things within the OpenAI ecosystem:</p><blockquote><p>In plain terms, Codex is OpenAI’s software engineering agent, available through mul...
5日前
2/22 (日)

Claude Codeで初めてのOSSコントリビューション体験記
hang-up
※事前にOSSのREADMEやContributes.mdを確認して下さい。私の場合、AIの使用が禁止されているOSSではなかったので、試しています。(プルリクエストを出すだけなので、ダメだったとしても弾かれるはずです)続きをみる
5日前

Claude Codeエージェント実践 Day 22|レポーティングエージェント初回実行 — 設計は動くのか
Akiraさんのフィード
TL;DR昨日設計したレポーティングエージェントを実際に構築し、BigQuery → Python → HTML のダッシュボード生成に成功したWindows の Python subprocess で bq コマンドが見つからないハマりポイントがあったが、shell=True で解決。「道具を作る」エージェントならではの環境依存問題生成に成功した3つのコンポーネント(サマリーカード、データテーブル、横棒グラフ)をテンプレートとして knowledge/ に切り出した。これが安定生産の第一歩 作ったものGitHub: akira-cloudjob-public/rep...
6日前
2/21 (土)

ブラウザがGPUメモリを使いすぎるので、サブGPUのRTX3050を使わせる
きしだのHatena
30BくらいまでのLLMはRTX 4060 Ti 16GBを使っていろいろ試すわけですが、ブラウザが4GBくらいGPUを使ったりしていて結構こまりものでした。 で、年末にふとRTX 3050を買っていて、LLM読み込みであふれた分が3050にまわるようにしていました。 VRAMちょい足しにRTX 3050 6GBを追加してみる - きしだのHatena けど、よく考えるとブラウザにRTX 4060 Tiを使わせる理由があまりないので、RTX 3050を使わせるといいのでは、と設定をしてみました。 ブラウザは常駐でそこまでGPU性能を求めないのに常にGPUメモリを使ってるので。 「システム > …
6日前

Quoting Thibault Sottiaux Simon Willison's Weblog
<blockquote cite="https://twitter.com/thsottiaux/status/2024947946849186064"><p>We’ve made GPT-5.3-Codex-Spark about 30% faster. It is now serving at over 1200 tokens per second.</p></blockquote><p class="cite">&mdash; <a href="https://twitter.com/thsottiaux/status/2024947946849186064">Thibault Sottiaux</a>, OpenAI</p> <p>Tags: <a href="https://simonwillison.net/tags/openai">openai</a>, <a href="https://simonwillison.net/t...
7日前

Andrej Karpathy talks about "Claws" Simon Willison's Weblog
<p><strong><a href="https://twitter.com/karpathy/status/2024987174077432126">Andrej Karpathy talks about &quot;Claws&quot;</a></strong></p>Andrej Karpathy tweeted a mini-essay about buying a Mac Mini ("The apple store person told me they are selling like hotcakes and everyone is confused") to tinker with Claws:</p><blockquote><p>I'm definitely a bit sus'd to run OpenClaw specifically [...] But I do love the concept and I think that j...
7日前

Adding TILs, releases, museums, tools and research to my blog Simon Willison's Weblog
<p>I've been wanting to add indications of my various other online activities to my blog for a while now. I just turned on a new feature I'm calling "beats" (after story beats, naming this was hard!) which adds five new types of content to my site, all corresponding to activity elsewhere.</p><p>Here's what beats look like:</p><p><img src="https://static.simonwillison.net/static/2026/three-beats.jpg" alt="Screenshot of a fragment of a page showing three entries f...
7日前

Taalas serves Llama 3.1 8B at 17,000 tokens/second Simon Willison's Weblog
<p><strong><a href="https://taalas.com/the-path-to-ubiquitous-ai/">Taalas serves Llama 3.1 8B at 17,000 tokens/second</a></strong></p>This new Canadian hardware startup just announced their first product - a custom hardware implementation of the Llama 3.1 8B model (from <a href="https://simonwillison.net/2024/Jul/23/introducing-llama-31/">July 2024</a>) that can run at a staggering 17,000 tokens/second.</p><p>I was going to include a v...
7日前

Claude Codeエージェント実践 Day 21|レポーティングエージェント設計 — 道具を使うから道具を作るへ
Akiraさんのフィード
TL;DR3体目のエージェント「レポーティングエージェント」を設計した。Python + HTML でダッシュボードを生成する、道具を作る エージェントagent-scaffold-factory テンプレートで雛形を生成し、CLAUDE.md・スキル・ナレッジを設計。テンプレート効果は健在で、設計作業は半日で完了「道具を使う」エージェントと「道具を作る」エージェントでは、CLAUDE.md に書くべきことが根本的に違う。出力品質の制約をどう伝えるかが設計の肝になった 作ったものGitHub: akira-cloudjob-public/reporting-agent...
7日前

ggml.ai joins Hugging Face to ensure the long-term progress of Local AI Simon Willison's Weblog
<p><strong><a href="https://github.com/ggml-org/llama.cpp/discussions/19759">ggml.ai joins Hugging Face to ensure the long-term progress of Local AI</a></strong></p>I don't normally cover acquisition news like this, but I have some thoughts.</p><p>It's hard to overstate the impact Georgi Gerganov has had on the local model space. Back in March 2023 his release of <a href="https://github.com/ggml-org/llama.cpp">llama.cpp</a> made it pos...
7日前

SANDWORM_MODE: Shai-Hulud-Style npm Worm Hijacks CI Workflows and Poisons AI Toolchains
Socket
An emerging npm supply chain attack that infects repos, steals CI secrets, and targets developer AI toolchains for further compromise.
7日前








