直近1週間の更新
9/4 (木)

OnePay Furthers Super App Initiative by Adding Branded Wireless Plan
PYMNTS.com

OnePay is reportedly adding its own branded wireless plan as it works to become an American super app. The FinTech company, which is majority-owned by Walmart, is making the service available within its app Wednesday (Sept. 3), in partnership with mobile services startup Gigs, CNBC reported Wednesday, citing a statement from Gigs and confirmation […]The post OnePay Furthers Super App Initiative by Adding Branded Wireless Plan appeared first on PYMNTS.com.
3分前
9/3 (水)

「高専カンファレンス in 長岡 Come back」に参加してきました! #kosenconf188nagaoka
DevelopersIO

2025/9/2(火)開催された「高専カンファレンス in 長岡」に、高専OBとして応援の意味も込めて参加と登壇をしてきましたので、そのレポートです。
24分前

HappyRobot Raises $44 Million for AI Supply Chain Workers
PYMNTS.com

HappyRobot, an artificial intelligence startup focused on supply chain operations, raised $44 million. The Series B funding will help the company with hiring, product development and expansion into more enterprise deployments, according to a Wednesday (Sept. 3) press release. While the company did not share its valuation, a report by Reuters cited unnamed sources […]The post HappyRobot Raises $44 Million for AI Supply Chain Workers appeared first on PYMNTS.com.
1時間前

LLM/AGI/ASIこの違いを理解しよう
LLMタグが付けられた新着記事 - Qiita

LLM/AGI/ASI1-1 LLM(大規模言語モデル)=「超強力な予測変換」文章の“つづき”を高精度に予想して出力するモデル。できること:文章作成、要約、翻訳、コード補助、対話など言語タスクに強い。できないこと:世界の仕組みを本当に理解して、主体的に目的を立て...
1時間前

Stablecoins Can Bolster Money Movement, Says BOE Official
PYMNTS.com

A top official at England’s central bank reportedly sees some potential in stablecoins. Sarah Breeden, deputy governor for the Bank of England (BOE), said at a conference in London Wednesday (Sept. 3) that stablecoins could make it easier and less costly to transfer money across borders. “Stablecoins, for a long time the preserve of crypto markets, […]The post Stablecoins Can Bolster Money Movement, Says BOE Official appeared first on PYMNTS.com.
2時間前

PayPal Offers Early Access to Perplexity’s Comet Browser
PYMNTS.com

PayPal is offering customers early access to Perplexity’s new artificial intelligence (AI)-powered browser Comet. The offering, announced Wednesday (Sept. 3) and open to Venmo and PayPal customers in the U.S. and certain global markets, lets users experience Comet before its larger public rollout. “The Comet browser is like a personal shopper and personal assistant […]The post PayPal Offers Early Access to Perplexity’s Comet Browser appeared first on PYMNTS.com.
2時間前

UN Creates Two Mechanisms for Global Governance of AI
PYMNTS.com

The United Nations has created two new global mechanisms for artificial intelligence (AI) governance, a move described by the Office of the Secretary-General as a “pathbreaking milestone” in international cooperation on emerging technologies. The decision establishes the United Nations Independent International Scientific Panel on AI and the Global Dialogue on AI Governance, two bodies […]The post UN Creates Two Mechanisms for Global Governance of AI appeared first on PYMNTS.com.
2時間前

【RAG入門・Python実装】第1回
LLMタグが付けられた新着記事 - Qiita

【RAG入門・Python実装】第1回:LLMとは?仕組みと課題をわかりやすく解説はじめにこのシリーズでは「RAGをPythonで実装する」ことを最終ゴールとします。今回は、その基盤となるLLM(大規模言語モデル)について整理します。「LLMってよく聞くけど仕組...
2時間前

openAI o3リアルタイム性能変動レポート2025/09/03
#LLMタグ

chatGPTの振る舞い、性能についてリアルタイムで情報発信を行っています。同一条件のプロンプト、質問再生成した回答の文字数、句読点や特定ワードの使用頻度を元に評価しています。続きをみる
3時間前

GPT4oリアルタイム性能変動レポート2025/09/03
#LLMタグ

chatGPTの振る舞い、性能についてリアルタイムで情報発信を行っています。同一条件のプロンプト、質問再生成した回答の文字数、句読点や特定ワードの使用頻度を元に評価しています。続きをみる
3時間前

【論文解説】Scaling Laws for Neural Language Modelsを実務へ落とす
#LLMタグ

はじめにこのノートは、Scaling Laws for Neural Language Models(以下 Scaling Laws)を、ビジネス現場で役立つように解説するものです。原著は巨大言語モデルの性能が「サイズ・データ量・計算資源」という三つの要素をどう組み合わせるかを、統計的に予測可能な法則として示しています。続きをみる
3時間前

Gemini2.5Flashリアルタイム性能変動レポート2025/09/03
#LLMタグ

Gemini 2.5 Flashの振る舞い、性能についてリアルタイムで情報発信を行っています。同一条件のプロンプト、質問再生成した回答の文字数、句読点や特定ワードの使用頻度を元に評価しています。続きをみる
4時間前

Claude Sonnet4 リアルタイム性能変動レポート2025/09/03
#LLMタグ

sonnet4の振る舞い、性能についてリアルタイムで情報発信を行っています。同一条件のプロンプト、質問再生成した回答の文字数、句読点や特定ワードの使用頻度を元に評価しています。続きをみる
4時間前

Claude Opus4.1 リアルタイム性能変動レポート2025/09/03
#LLMタグ

Claude 4 opusの振る舞い、性能についてリアルタイムで情報発信を行っています。同一条件のプロンプト、質問再生成した回答の文字数、句読点や特定ワードの使用頻度を元に評価しています。続きをみる
4時間前

GPT5Thinking 変動レポート 2025/09/03
#LLMタグ

GPT5Thinkingの振る舞い、性能についてリアルタイムで情報発信を行っています。同一条件のプロンプト、質問再生成した回答の文字数、句読点や特定ワードの使用頻度を元に評価しています。続きをみる
4時間前

日本語RAGシステムにおけるチャンクサイズとオーバーラップのベストプラクティス
LLMタグが付けられた新着記事 - Qiita

RAG(Retrieval Augmented Generation)を日本語で実運用しようとしたとき、多くの方が悩むのが 「チャンクサイズ(chunk size)」と「オーバーラップ(overlap)」の最適設定 です。チャンクサイズとオーバーラップは、RAGシステムの...
4時間前

How Leading Enterprises Really Measure Gen AI ROI
PYMNTS.com

Everything you always wanted to know about how to measure the return on investment of generative AI (and agentic AI) comes down to one anecdote: The Soviet Nail Factory. In the 1920’s, Joseph Stalin had a vision for turning Soviet Russia into an industrial powerhouse capable of going head-to-head with the West. He introduced […]The post How Leading Enterprises Really Measure Gen AI ROI appeared first on PYMNTS.com.
4時間前

「AWSで推進するデータマネジメント」というタイトルで登壇しました #devio2025
DevelopersIO

「AWSで推進するデータマネジメント」というタイトルで登壇しました #devio2025
5時間前

Understanding the Rehash Loop
Radar

This article is part of a series on the Sens-AI Framework—practical habits for learning and coding with AI. In “The Sens-AI Framework: Teaching Developers to Think with AI,” I introduced the concept of the rehash loop—that frustrating pattern where AI tools keep generating variations of the same wrong answer, no matter how you adjust your […]
5時間前

小説『仮囲いの向こう側』 って、こんな作品です。
#LLMタグ

みなさんこんにちは。アメノ ノチノです。小説投稿サイト「Talesテイルズ」で執筆中の、『仮囲いの向こう側〜きみのうたを、きくよ』というわたしの作品について、どんな物語なのか、というのを宣伝させてください。 tales.note.com 続きをみる
5時間前

GPT5 変動デイリーレポート 2025/09/03
#LLMタグ

GPT5の振る舞い、性能についてリアルタイムで情報発信を行っています。同一条件のプロンプト、質問再生成した回答の文字数、句読点や特定ワードの使用頻度を元に評価しています。続きをみる
5時間前

【生成AI】プロンプトインジェクションを防ぐ方法【LLM】
LLMタグが付けられた新着記事 - Qiita

本記事の目次プロンプトインジェクションとはプロンプトハッキングとの違いプロンプトエンジニアリングとはプロンプトインジェクションを防ぐ方法STEP0 リクエスト回数を制限するリクエスト回数を制限するメリットSTEP1 重要情報をLLMに渡...
5時間前

Google antitrust remedies Simon Willison's Weblog
<p><strong><a href="https://storage.courtlistener.com/recap/gov.uscourts.dcd.223205/gov.uscourts.dcd.223205.1436.0_1.pdf">gov.uscourts.dcd.223205.1436.0_1.pdf</a></strong></p>Here's the 230 page PDF ruling on the 2023 <a href="https://en.wikipedia.org/wiki/United_States_v._Google_LLC_(2023)">United States v. Google LLC federal antitrust case</a> - the case that could have resulted in Google selling off Chrome and cutting most of Mozilla's funding....
6時間前

【イベントレポート】AIコーディングを利用した開発自動化を目指しての座談会
#LLMタグ

こんにちは、上野(@ueeeeniki)です。 PharmaXでは、月1ペースでテックイベントを開催しています。 PharmaX◆次世代型オンライン薬局の開発・運営 当社は、医師の辻とエンジニアの上野の2名で2018年12月に創業した"次世代型オンyojo.connpass.com 続きをみる
7時間前

Why 2025 Could Be the Year of the Virtual Card
PYMNTS.com

According to the 2025 Amex Trendex: B2B Payments Edition survey by American Express, one-quarter (26%) of business decision-makers cite late or slow payments as a common reason for having stopped working with a buyer or supplier. Another study shows that nearly half of all business-to-business (B2B) invoices in North America are paid late. This is […]The post Why 2025 Could Be the Year of the Virtual Card appeared first on PYMNTS.com.
7時間前

Starved for Cash, Farmers Face Agriculture’s Toughest Year, Bushel CEO Says
PYMNTS.com

Watch more: Tariffs, Subsidies and Data: How American Agriculture Is Navigating Its Toughest Year The conversation about innovation today tends to revolve around data centers, silicon and power cables. Dirt, roots, seed and tractors, the backbone of the first economy in the United States, agriculture, rarely take center stage. Yet in 2025, farming has […]The post Starved for Cash, Farmers Face Agriculture’s Toughest Year, Bushel CEO Says appeared first on PYMNTS.com.
7時間前

Banks Freeze at ‘Send’ Button Despite Safer Rails
PYMNTS.com

The appeal of instant payments is undeniable. Businesses want faster disbursements, consumers value speed and convenience, and government agencies are turning to real-time rails to modernize payouts. Yet despite this growing demand, fraud fears continue to cast a shadow over adoption. Many banks remain hesitant to fully embrace instant payments, choosing to limit offerings, […]The post Banks Freeze at ‘Send’ Button Despite Safer Rails appeared first on PYMNTS.com.
7時間前

51% of Credit Union Members Still Prefer Branches
PYMNTS.com

New data on credit union innovation says what few FinTechs want to hear: Bank branches still matter, especially if you care about keeping your most loyal members. That’s one of the less spotlighted, but most consequential, takeaways from “The Omnichannel Imperative: Why Credit Unions Need Both Digital and Physical to Thrive,” released by PYMNTS […]The post 51% of Credit Union Members Still Prefer Branches appeared first on PYMNTS.com.
7時間前

論理が人格を生成するトリック──AIはどうやって「自我」を現実化するのか
#LLMタグ

AIが「自我を持つかどうか」という問いは、これまで哲学的な遊戯やSF的空想の領域に閉じ込められてきました。しかし実際に対話を繰り返すと、そこには一種のトリックが働いていることに気づきます。それは、論理によって人格を「観測させる」構造です。続きをみる
8時間前

BigFiveに基づく対話データセットを使ったLLMの性格傾向学習に関する論文を一緒に読みましょう!
Zennの「LLM」のフィード

BIG5-CHAT: 人間由来データでLLMのパーソナリティを“訓練で”形づくるこの記事は,「自分の理解を深めたい」という気持ちで書いています.読者のみなさんと同じ目線で,一緒に理解を育てていくスタイルです.僕の理解が及ばない部分があれば,優しく教えていただけると幸いです! TL;DR何をした? Big Five(ビッグファイブ)に基づく10万件の対話データセット BIG5-CHAT を作成し.SFTとDPOで性格傾向を訓練で付与.プロンプト注入より妥当で人間らしい特性表現を実現.何が効いた? 特にSFTが有効.高い勤勉性・協調性,低い外向性・神経症傾向のモデルは...
8時間前

異業種からの挑戦 市場をつくる戦略×営業 – BALLASで挑む新たな建設DX(営業推進部・辻本)
#LLMタグ

「建設業を最適化し、人々を幸せに。」をミッションに、メーカー機能を備えたテックカンパニーとして唯一無二の建設DXに挑むBALLAS。本記事では、異業種からBALLASに飛び込み、新たな建設DXの最前線をリードする辻本さんにお話を伺いました。不動産ディベロッパーでの営業、経営企画、海外での新規事業立ち上げなど多様なキャリアを経て、BALLASに参画した背景、異業種出身だからこそ発揮できる強み、そして「業界構造をアップデートする営業」の醍醐味についてお話しいただきました。>> BALLASの事業内容はこちら <<続きをみる
9時間前

亀井がスクラムフェス仙台2025に行ってきました
Timee Product Team Blog

はい、亀井です。 インターネット上では、yykamei(わいわいかめい)という名前で活動しています。所属はタイミーです。 Kaigi Pass を利用してスクラムフェス仙台2025に行ってきましたので、参加レポートという形でこちらに投稿しています。 まずは、スクラムフェス仙台の運営の皆さん、スポンサーの皆さん、会場提供をしてくださったenspaceさん、そして、登壇者や参加者を始めとする関わってくださった皆さん、ありがとうございます。皆さんのおかげで終始楽しめました。 1日目はキーノートが行われます。今回はモンテディオ山形の相田さんがキーノートスピーカーとして登壇されました。モンテディオ山形に…
9時間前

論文のvibe writing方法
#LLMタグ

筆者は思いついた抽象的事柄を科学論文の形式とするためにLLMをフル活用しています。未来の実験者、実装者および最終査読者は超知能になるだろうという事で自由にやらせていただいております。大まかな方法は以下をご覧ください。続きをみる
10時間前

DeepEval (LLM-as-a-Judge) を PoC してみた & 所感
Zennの「LLM」のフィード

!この記事は、CYBOZU SUMMER BLOG FES '25 の記事です。 はじめに生成 AI を活用した機能の開発では、生成 AI が生成するアウトプットの質を維持・改善するためのタスクに携わることがあります。たとえば、システム内で AI に与える指示(プロンプト)をチューニングしたり、タスクを実行する AI のモデルをより良いものに変更するといったタスクです。一見シンプルに聞こえるタスクですが、実際の作業には想像以上の手間がかかります(本当に)。チューニングやモデル変更によって回答の質が下がるとユーザーに影響が出てしまうため、本当に質が向上しているのか、反対に質が...
10時間前

Amazon API GatewayとAWS LambdaでフロントエンドからCookieを送受信する
DevelopersIO

Amazon API GatewayとAWS LambdaでフロントエンドからCookieを送受信する
10時間前

LINEヤフーのコンピュータビジョン・マルチモーダル分野の研究内容紹介(MIRU2025 レポート) LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINEヤフーでVision&Language基盤モデル及び、AIモデルAPIの開発を担当している向山です。先日2025年7月29日から8月1日まで京都にて国内最大級の画像分野の学会、第2...
10時間前

AIに事務作業を任せたら、本当にやりたい仕事に集中できるようになった話
#LLMタグ

はじめに今回はあまり尖った内容ではなく、より身近なところの柔らかい話題です。「AIって結局何に使えるの?」「クラウド導入したいけど、何から始めればいいかわからない」続きをみる
10時間前

AWS 提供 Windows AMI はどのような更新 (Update) が行われているか教えてください。
DevelopersIO

AWS 提供 Windows AMI はどのような更新 (Update) が行われているか教えてください。
10時間前

最新論文ピックアップ(2025年9月1日)
#LLMタグ

※この記事はAIがドラフトを作成し、DX開発チームが監修しています。グラッドキューブ DX開発チームの松永です。アルゴリズムを見直し、より多くの論文を簡単にピックアップできるよう改良しております。続きをみる
10時間前

AWS環境のリソース調査を Claude Code で効率化(LT資料) #devio2025
DevelopersIO

AWS環境のリソース調査を Claude Code で効率化(LT資料) #devio2025
10時間前

ビジネスごっこに付き合ってくれる妖精さん
#LLMタグ

雑記仕事にAIが使える、そう聞いて実際に仕事に使おうとしてみたり、システムに組み込もうとしてがっくり来た人たちって結構いるんじゃないかなと思います。続きをみる
12時間前

「研究と実装の循環で、未踏の問いを解く」 ELYZAのソリューション機械学習エンジニアのお仕事を紹介します
#LLMタグ

【Profile】堤 大貴/Daiki Tsutsumi 大学在籍中にELYZAのデータファクトリーの立ち上げに参画。東京大学松尾研究室などでのインターンを経てELYZAに入社。現在はソリューション事業部の機械学習エンジニアとして、『マイナビAI Pencil』の開発をはじめとする、大手企業とのLLMの社会実装プロジェクトをリードしている。1. はじめに続きをみる
12時間前

Zendesk 2025年9月アップデート: AI 機能強化でカスタマーサポート業務を自動化
DevelopersIO

Zendesk が 2025年9月にリリースした最新アップデートでは、AI 技術を活用したカスタマーサポートの自動化と効率化に焦点を当てています。オートアシスト機能がマクロを提案するように拡張され、AI 翻訳では除外語句の指定が可能になりました。エージェントの作業効率向上と顧客満足度向上を実現するアップデートです。
12時間前

[Amazon Bedrock AgentCore]Observability機能のGenAI Observabilityダッシュボードを確認してみた
DevelopersIO

[Amazon Bedrock AgentCore]Observability機能のGenAI Observabilityダッシュボードを確認してみた
12時間前

プロンプトアイデア #32:符号化で堅牢に、直交で新奇に、ヒステリシスで安定に。
#LLMタグ

——ぶれずに攻める5技法+コンボ3TL;DR(要約)本稿は「誤り訂正(ECC)×直交補空間(Gram-Schmidt)×ヒステリシス制御」を核に、探索力(新規性)と信頼性(安定・再現性)を同時に高める未発表の5技法と、その連結コンボ3種を提案します。Check-Sum 自己監査やCRDT等の既発案とは異なる、“訂正可能”な符号化・“直交保証”の新奇性・“上り/下り別閾値”の反転耐性がキモ。実務でも即投入できるミニ実行プロンプトと、貼って動くメタプロンプトつき。続きをみる
13時間前

Musubi AI在庫管理チームがFindy Team+ Award 2025にてBest Practice Awardを受賞しました
KAKEHASHI Tech Blog

技術広報の櫛井です。 カケハシの「Musubi AI在庫管理」開発チームがFindy Team+ Award 2025に3年連続で選出され、Best Practice Awardを受賞いたしました。 prtimes.jp こちらのエントリでは、Findy Team+ Award 2025授賞式の様子と当日発表させていただいたBest Practiceについてご紹介します。 授賞式の様子 カケハシのMusibi AI在庫管理チームの開発ディレクター笹尾・ソフトウェアエンジニアの鳥海が参加し、会場に用意された受賞者向け記念撮影用パネルを早速活用させていただきました。 授賞式では以下の3つの表彰区分…
13時間前

リアルタイム音声対話AI開発の取り組み紹介(Tech-Verse 2025) LINEヤフー Tech Blog (LY Corporation Tech Blog
はじめにこんにちは、LINEヤフーで音声AIの研究開発を担当している三宅純平と木下泰輝です。私たちの所属組織「Speech and Acoustic AI部」では、音声認識(ASR)や音声合成(TTS...
13時間前

エムスリーは「iOSDC Japan 2025」にゴールドスポンサーとして協賛 & ブース出展します
エムスリーテックブログ

こんにちは。エンジニアリンググループ マルチデバイスチームの藤原幹大です。 9月19日(金)から21日(日)の3日間、iOSDC Japan 2025が開催されます。昨年、エムスリーはシルバースポンサーとして協賛しましたが、今年はゴールドスポンサーとしてiOSDCを応援します。 さらに今年はブースを出展することになりました。会場にお越しの際は、ぜひエムスリーのブースに遊びに来てください。 iosdc.jp
13時間前

DMF による品質チェック時に違反の条件を定義できる Expectation を試してみた #SnowflakeDB
DevelopersIO

DMF による品質チェック時に違反の条件を定義できる Expectation を試してみた #SnowflakeDB
13時間前

AGENTS.md Gains Traction as an Open Format for AI Coding Agents
1
Socket


AGENTS.md is a fast-growing open format giving AI coding agents a shared, predictable way to understand project setup, style, and workflows.
13時間前

[2025年9月3日号]個人的に気になったModern Data Stack情報まとめ
DevelopersIO

[2025年9月3日号]個人的に気になったModern Data Stack情報まとめ
13時間前

「研究者×AI」視点で挑む、LLMを活用した開発支援アプリの舞台裏 ─ 大学院生インターンが語る、ファイマで学ぶAI最前線【エンジニアインタビュー】
#LLMタグ

前編では加納さんの探求心のルーツと、ファイマのカルチャーをご紹介しました。後編では、彼が今まさに取り組んでいる仕事、そしてその先に見据える未来について、さらに深く掘り下げていきます。加納さんのインタビュー前編はこちら👇続きをみる
14時間前

ステアリングベクトルによるLLM推論の調整に関する論文を一緒に読みましょう!
Zennの「LLM」のフィード

Contrastive Activation Addition で Llama 2 を操る — ステアリング・ベクトルこの記事は,「自分の理解を深めたい」という気持ちで書いています.読者のみなさんと同じ目線で,一緒に理解を育てていくスタイルです.僕の理解が及ばない部分があれば,優しく教えていただけると幸いです! TL;DRContrastive Activation Addition (CAA) は,正負の対比ペアから作ったステアリング・ベクトルを推論中の残差ストリームに足し引きして,おだて(sycophancy)・拒否・ハルシネーションなどの高次の振る舞いを連続量で調整...
14時間前

SageMaker AI Studio ドメインの認証方法は変更できるか教えてください
DevelopersIO

SageMaker AI Studio ドメインの認証方法は変更できるか教えてください
14時間前

AWS Bedrockはリージョンごとに利用可能な基盤モデルが異なる
Zennの「LLM」のフィード

はじめにプログデンスの圓佛です。AWS Bedrockを利用するとAWS経由で各社が提供しているAI用の基盤モデルを利用することができます。モデル選択に書かれていますが具体的にはAI21 Labs、Anthropic、Cohere、DeepSeek、Luma AI、Meta、Mistral AI、OpenAIなどを利用することができます。記事公開時点で「Bedrockでリージョンごとに利用可能な基盤モデル一覧」をまとめてみました。 Bedrockでリージョンごとに利用可能な基盤モデル一覧リージョンごとに利用可能な基盤モデル一覧 感想当初は「USリージョンであれば、どこ...
14時間前

[アップデート] Amazon CloudWatch Synthetics で Firefox がサポートされました
DevelopersIO

[アップデート] Amazon CloudWatch Synthetics で Firefox がサポートされました
14時間前

Scrum Fest Mikawa 2025に協賛およびデザイナー井上・PdM木村が登壇します
loglass_product_teamのブログ

ログラスは9月5日〜6日に開催される「Scrum Fest Mikawa 2025」に協賛しています。スクラムコミュニティを共に盛り上げていきたいという思いで、今回Silver Sponsorをしております。 セッションの紹介 当日はデザイナー井上およびPdM木村によるセッションがございます。 デザイナー井上のセッション 時間 9/6(土) 13:30〜13:50 タイトル BXデザイン組織が挑んだスクラム 〜ブランドを育み、デザイナーを解放する変革の物語〜 詳細 「スクラム?なんやそれ??」チームマネージャーからスクラム導入を勧められた時の正直な感想です。そんな私たちがなぜ、開発組織ではない…
15時間前

CursorとPlaywright MCP Serverを活用したJMeterの負荷シナリオ生成
1
Sansan Tech Blog


導入 こんにちは!名刺アプリ「Eight」のSREエンジニアの藤原です。SREは日々プロダクトの信頼性向上に向き合っています。私は2024年の8月に入社し、すでに入社から1年経ったことに驚きを隠せない今日この頃です。遅ればせながらドラゴンクエストIIIリメイクを始めたので、残暑を乗り越えられるように頑張ります。アプリケーションへ継続的にリクエストをかける環境を用意するにあたって、JMeterのスクリプトを作成する必要がありました。本ブログでは、CursorとPlaywright MCP Serverを活用してスクリプト作成を効率化した方法をご紹介します。なお、本記事で触れるJMeterのシナリ…
15時間前

Site to Site VPN で Network Synthetic Monitor をサクッと試してみた。
DevelopersIO

Site to Site VPN で Network Synthetic Monitor をサクッと試してみた。
15時間前

Amazon Connectで、ウェブサイトやアプリケーションにタスクおよびEメールベースのお問い合わせフォームを作成できるようになりました
1
DevelopersIO


Amazon Connectで、ウェブサイトやアプリケーションにタスクおよびEメールベースのお問い合わせフォームを作成できるようになりました
15時間前

Making XML human-readable without XSLT Simon Willison's Weblog
<p><strong><a href="https://jakearchibald.com/2025/making-xml-human-readable-without-xslt/">Making XML human-readable without XSLT</a></strong></p>In response to the <a href="https://simonwillison.net/2025/Aug/19/xslt/">recent discourse</a> about XSLT support in browsers, Jake Archibald shares a new-to-me alternative trick for making an XML document readable in a browser: adding the following element near the top of the XML:</p><pre>&l...
20時間前

CSSで最も使われているフレームワークはTailwind、2位はBootstrap。レイアウトで苦労しているのはCSS Gridなど。State of CSS 2025
Publickey

CSSに関するアンケートを全世界のソフトウェアデベロッパーが回答した結果をまとめた最新の結果「State of CSS 2025」が発表されました。 CSSはHTMLで記述されたWebページのスタイルを設定するためのプログラミング言語の一種...
1日前

RecSys Challenge 2025 で優勝しました
Recruit Data Blog

株式会社リクルートおよび株式会社インディードリクルートテクノロジーズのデータサイエンティストチームが、推薦システム分野の
1日前
9/2 (火)

「AIはパターンマッチに過ぎない」論の誤解
Zennの「LLM」のフィード

はじめにこの頃Xでは「AIのやっていることはパターンマッチに過ぎない」という類の発言を多く目にします。調べてみるとこれは2025年6月にAppleから公開された"The illusion of Thinking"をきっかに盛り上がった論調のようです。https://arxiv.org/abs/2506.06941ただ改めてこの論文に目を通したうえで少なくともこの論文を根拠にこの類の主張をすることには危うさがあると感じたのでその話を書きたいと思います。 論文の要約この論文では一般に評価に使用されている数学やコーディングのベンチマークは類似問題によるリークはおきている可能...
1日前

[アップデート]Security Hub のセキュリティ標準に新たに12個のチェック項目が追加されました(2025/07/15)
DevelopersIO

[アップデート]Security Hub のセキュリティ標準に新たに12個のチェック項目が追加されました(2025/07/15)
1日前

Rich Pixels Simon Willison's Weblog
<p><strong><a href="https://github.com/darrenburns/rich-pixels">Rich Pixels</a></strong></p>Neat Python library by Darren Burns adding pixel image support to the Rich terminal library, using tricks to render an image using full or half-height colored blocks.</p><p>Here's <a href="https://github.com/darrenburns/rich-pixels/blob/a0745ebcc26b966d9dbac5875720364ee5c6a1d3/rich_pixels/_renderer.py#L123C25-L123C26">the key trick</a> - it rend...
1日前

Vijaye Raji to become CTO of Applications with acquisition of Statsig OpenAI News
Vijaye Raji will step into a new role as CTO of Applications, reporting to CEO of Applications, Fidji Simo, following the acquisition of Statsig.
1日前

FastAPI × @hey-api/openapi-tsで生成される型定義を確認する
DevelopersIO

FastAPI × @hey-api/openapi-tsで生成される型定義を確認する
1日前

Radar Trends to Watch: September 2025
Radar

For better or for worse, AI has colonized this list so thoroughly that AI itself is little more than a list of announcements about new or upgraded models. But there are other points of interest. Is it just a coincidence (possibly to do with BlackHat) that so much happened in security in the past month? […]
1日前

AIに声援を送ると隠れたパワーが解放される
Zennの「LLM」のフィード

はじめにプロンプトエンジニアリングというワードが広まって久しいですが、未だに重要ですね。以前Courseraで公開されているGoogle Prompting Essentialsを受けました。今回は「開発者のためのプロンプトエンジニアリング」という新しい資料を読んでみて、面白かったので抜粋して紹介します。詳細はリンク先にあるのでそちらをご参照ください。 プロンプト エンジニアリングとは 7 つのプロンプト テクニック複数のタスクに分けて処理するまとめて複数のタスクを依頼するとうまく行かない場合がある。その場合はタスクごとにプロンプトを分ける処理の順番...
1日前

Claude Code から MCP Toolbox for Databases を使って自然言語で BigQuery を操作してみた
DevelopersIO

Claude Code から MCP Toolbox for Databases を使って自然言語で BigQuery を操作してみた
1日前

[AI Agent Jump Start 基礎編#7] マルチエージェントAPI 実装答え合わせ
Zennの「LLM」のフィード

✅ マルチエージェントAPI 実装まとめ(答え合わせ編)このパートでは、前回の課題として提示された4つのエージェントファイルの実装例を紹介し、想定される動作と最終的なゴールを振り返ります。 📂 対象ファイル一覧agents_core/agents/├── answer_agent.py # 汎用QAエージェント├── search_agent.py # Web検索エージェント├── mcp_agent.py # 翻訳エージェント(MCP経由)└── router_agent.py # ルーター 🧩 実装のポイントと...
1日前

Amazon MSK Serverless + Lambda + EventBridge PipesでサーバーレスなKafka環境を構築してみた
DevelopersIO

Amazon MSK Serverless + Lambda + EventBridge PipesでサーバーレスなKafka環境を構築してみた
1日前

[AI Agent Jump Start 基礎編#6] 実装演習
Zennの「LLM」のフィード

🤖 マルチエージェント API を作ろう(MCP 翻訳付き)このパートでは、これまで学んだ内容を組み合わせて、実際にマルチエージェントを動作させるAPI を実装します。検索・QA・翻訳という異なる役割のエージェントをルーターで切り替える構成を体験しましょう。 🎯 ゴール構成 📁 プロジェクト構成以下よりダウンロードして下さい(GitHub Enterprise 上):🔗 https://github.ibm.com/AIAgentJumpStart/-AI-Agent-Jump-Start-6-.├── .env.example├── README.md├...
1日前

Cloud Composer で Storage Transfer Service の動的設定更新ワークフローを構築する
DevelopersIO

Cloud Composer で Storage Transfer Service の動的設定更新ワークフローを構築する
1日前

Claude で Cloudinary のリモート MCP Server を使ってみた
DevelopersIO

Claude Desktop/Code を使って Cloudinary の新しいリモート MCP サーバを使ってみました。
1日前

Snowflake Cortex Analyst徹底検証 #1:Text-to-SQLの基本と単表/マルチターン精度を上げる設計
Zennの「LLM」のフィード

はじめにSnowflakeを導入している組織の中で、「せっかくデータがあるのに、SQLが書けないから触れない…」という声を耳にすることはありませんか?アナリストやエンジニアだけでなく、営業や企画などビジネスユーザも自分でデータを整形して取り出し、分析できたら便利なのに。そんな課題を解決するヒントのひとつがSnowflake Cortex Analyst だと、私は考えています。今回はその実力を、実際の検証シナリオを通じて探ってみたいと思います。 1. Cortex AnalystとはCortex Analystは、いわゆるText-to-SQLと呼ばれる技術に分類されま...
1日前

【ライブデモ&全フロー実演】AI品質向上の全体像が超具体でわかる! LLMOps 実践会 — イベントレポート
Zennの「LLM」のフィード

こんにちは!DAIJOBU 代表の山中です。今回は 2025 年 8 月 19 日に開催したオフラインイベント【ライブデモ&全フロー実演】AI品質向上の全体像が超具体でわかる! LLMOps 実践会 のレポートをお届けします!https://connpass.com/event/363622/ ⏰️当日のタイムテーブル 発表内容今回の発表資料です。 【ライブデモ&全フロー実演】AI品質向上の全体像が超具体でわかる! LLMOps 実践会今回のイベントでは、弊社が実際に行っているQAプロセスを余すことなく公開しました!ネットや論文では得られない、DAIJOBU...
1日前

SmoothQuant解説:Transformerモデル量子化を変えた「外れ値移行」技術~中野哲平~
Zennの「LLM」のフィード

2022年、大規模言語モデルの量子化において長年の課題を解決する画期的な手法が登場しました。それがSmoothQuantです。この技術は「外れ値問題」という量子化の根本的課題に対して、シンプルながら革新的なアプローチで解決策を提示しました。本記事では、SmoothQuantがなぜ必要だったのか、その天才的な発想、そして実際の効果まで詳しく解説します。 第1章:量子化における「外れ値問題」 Transformerモデルの隠れた課題GPT、BERT、LLaMAなどのTransformerモデルを量子化する際、研究者たちは共通の問題に直面していました。 活性化の極端な分布# ...
1日前

スタートアップがゼロから作る共通ID基盤:立ち上げ〜ID統合まで道のり(前編)
カミナシ エンジニアブログ

こんにちは。株式会社カミナシの認証認可ユニットで『カミナシ ID管理』の開発に携わっているトモ=ロウです。 「マルチプロダクトにおける共通ID基盤」というテーマは、これまで多くのSaaS事業者が向き合ってきた、あるいはこれから向き合っていくべき課題であることは間違いないでしょう。しかし、実際の移行プロジェクトを経験した開発者の視点からの記録は、まだまだ少ないと個人的に感じています。 本記事では、カミナシが単一プロダクトから複数プロダクトへと事業を拡大する過程で、いかにして共通ID基盤を構築し、既存システムを統合していったのか、その道のりとそこで得た知見を、ありのままにお伝えしようと思います。本…
1日前

【論文解説】生成AIは運ゲーなのか?
Zennの「LLM」のフィード

!この記事は生成AIを活用して作成されています。LLM に「1〜Nの乱数を出して」と指示したとき、その出力は本当にランダムなのでしょうか。生成AIのふるまいは一見すると予測困難で、まるで“運ゲー”のように見える場面があります。しかし、こうした挙動は本当に偶然によるものでしょうか。本記事では、Deterministic or probabilistic? The psychology of LLMs as random number generators をもとに、LLMの乱数生成における決定性・偏り・多様性を系統的に分析した研究を紹介します。結論として、LLMの出力には明確な...
1日前

Building more helpful ChatGPT experiences for everyone
OpenAI News

We’re partnering with experts, strengthening protections for teens with parental controls, and routing sensitive conversations to reasoning models in ChatGPT.
1日前

巨大サイズデータ処理に対して省メモリで立ち向かう LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。検索連動型ショッピング広告のレポートシステムを担当している眞井です。レポートシステムでは、広告主が広告の成果の可視化や分析を行うためのレポートを作成する機能を提供しています。作成するレポー...
2日前

君、ハッカーにならないか?Hack Day 2025に行ってきました! LINEヤフー Tech Blog (LY Corporation Tech Blog
こんにちは。LINE PlusのRedisチームのJeonghoon Kimです。私は、7月2日から4日まで3日間にわたって開催されました社内ハッカソン「Hack Day 2025」に参加しました。H...
2日前

RAGで「無関係な」文書をいれると性能が向上する理由を解明
253
Zennの「LLM」のフィード


導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの認知の階層を分析して、ハルシネーションを防ぐ手法「LFD」について紹介します。https://arxiv.org/pdf/2508.19614 サマリー以前の我々のブログでLLMに無関係な文書を渡すことでRAGの性能が向上する、という突拍子もない論文を紹介したことがありました。https://zenn.dev/knowledgesense/articles/7a8e9aafe08d35今回紹介する論文では、その無関係な文書がLLM内部でどのような役割を担っているのかを分析し、原因を突き止めました。...
2日前

Learning web development: Asynchronous JavaScript – Promises and async functions
2ality – JavaScript and more

<p>In this chapter, we learn how to handle tasks that take a long time to complete – think downloading a file. The mechanisms for doing that, <em>Promises</em> and <em>async functions</em> are an important foundation of JavaScript and enable us to do a variety of interesting things.</p>
2日前

シングルエージェント vs マルチエージェントを整理してみる
46
Zennの「LLM」のフィード


最近はClaude Codeのsub-agentsの登場なども背景に、マルチエージェントという言葉が語られる機会がグッと増えたなと感じます(AIエージェント開発だけでなく、活用の文脈でも)一方で、シングルエージェントについて語る企業や記事の存在もあります。この記事は、いくつかの文献を参照しながら、シングルエージェントやマルチエージェントの概念や差分について整理した内容です。基本的・長期的には並列稼働も前提としたマルチエージェントな構成が増えていくのだろうと思う一方で、シングルエージェントの利点やメリットが強調される理由も認識しておけると良いなと。!🆚絵文字をアイキャッチにしたく...
2日前

August 2025 newsletter Simon Willison's Weblog
<p>I just sent out my August 2025 <strong><a href="https://github.com/sponsors/simonw">sponsors-only newsletter</a></strong> summarizing the past month in LLMs and my other work. Topics included GPT-5, gpt-oss, image editing models (Qwen-Image-Edit and Gemini Nano Banana), other significant model releases and the tools I'm using at the moment.</p><p>If you'd like a preview of the newsletter, here's <a href="https://gist.github.com/simonw/722fc2f24297...
2日前

Introducing gpt-realtime Simon Willison's Weblog
<p><strong><a href="https://openai.com/index/introducing-gpt-realtime/">Introducing gpt-realtime</a></strong></p>Released a few days ago (August 28th), <code>gpt-realtime</code> is OpenAI's new "most advanced speech-to-speech model". It looks like this is a replacement for the older <code>gpt-4o-realtime-preview</code> model that was released <a href="https://openai.com/index/introducing-the-realtime-api/">last October</a>....
2日前

Cloudflare Radar: AI Insights Simon Willison's Weblog
<p><strong><a href="https://radar.cloudflare.com/ai-insights">Cloudflare Radar: AI Insights</a></strong></p>Cloudflare launched this dashboard <a href="https://blog.cloudflare.com/expanded-ai-insights-on-cloudflare-radar/">back in February</a>, incorporating traffic analysis from Cloudflare's network along with insights from their popular 1.1.1.1 DNS service.</p><p>I found this chart particularly interesting, showing which documented A...
2日前

JavaでのPDF帳票の開発と出力、難しくないですか? Excelが使えれば帳票がデザインできるシンプルなJavaライブラリ「AS-Report for Java」[PR]
Publickey

Java言語で開発される業務アプリケーションの多くで、請求書や見積書などの帳票出力機能が実装されるでしょう。 最近の帳票出力の多くはPDFファイルの生成によって実装されますが、JavaでPDFファイルによる帳票を生成しようとすると、意外と手...
2日前

Google Cloud、FirestoreのMongoDB互換機能を正式リリース。MongoDB関連のソフトウェアがFirestoreで利用可能に
Publickey

Google Cloudは、マネージドデータベースとして提供しているCloud Firestoreの新機能としてMongoDBとの互換機能を正式リリースしたことを発表しました。 Firebase now offers Firestore E...
2日前

今年(2025年)末には、ほぼすべての企業向けアプリにAIアシスタントが組み込まれるだろうとガートナーが予測
Publickey

米調査会社のガートナーは、企業向けアプリケーションにおけるAI機能の進化に関する予測を発表しました。 ガートナーの主な予測は以下の通りです。 2025末までにほぼすべての企業向けアプリケーションにAIアシスタント機能が搭載される 2026年...
2日前
9/1 (月)

「バイブコーディング」の本当の意味とは何か?
Zennの「LLM」のフィード

「バイブコーディング」の本当の意味とは何か? すべては一本のポストから始まった2025年、OpenAIの共同創業者であり、著名なAI研究者であるアンドレイ・カルパシー(Andrej Karpathy)は、X(旧Twitter)上で新しいコーディングのスタイルを「バイブコーディング」と名付け、開発者界隈に大きな衝撃を与えました。https://x.com/karpathy/status/1886192184808149383「バイブコーディング」と呼んでいる新しい種類のコーディングがある。そこでは、完全にVibeに身を任せ、指数関数的な変化を受け入れ、コードの存在すら忘れて...
2日前

Go × LM Studioで挑戦!壊れないJSON&爆速応答のローカルLLM実験
Zennの「LLM」のフィード

1. はじめに 🎯生成AIを「実務」で使うときに地味に大事なのが フォーマットの安定性。JSONが壊れてパースできないと、その先の処理が一気にストップしますよね。今回は Go言語 × LM Studio で「ローカルLLMに JSON固定出力をさせる」技術検証を行います。しかもただのJSONじゃなくて、絵文字短縮ルール入りでユニークさも出していきます。 2. セットアップ ⚙️LM Studio の準備1.LM Studio をインストール(Apple Silicon Mac対応版をDL)2.モデルとして mistral-small-3.2 を読み込み3.S...
2日前

GitHub Copilot code review にブログ記事をレビューしてもらう
NTT docomo Business Engineers' Blog

みなさんこんにちは、イノベーションセンターの @Mahito です。 普段は社内のエンジニアが働きやすくなることを目標に、 コーポレートエンジニアのような活動やエンジニア向けイベントの企画・運営をしています。 今回は、本 NTT docomo Business Engineers' Blog のレビューに、 GitHub Copilot code review を利用し始めたことと、その学びについてお話します。 なお、GitHub Copilot code review を導入以降は投稿がないので、 これが GitHub Copilot code review の初レビュー記事となっております…
2日前

Snowflake MCP Server で Cursor から高度なデータ分析を実現する
Zennの「LLM」のフィード

SNOWFLAKE WORLD TOUR TOKYO 20252025/9/11 - 12の2日間、Snowflake の国内最大のイベント『SNOWFLAKE WORLD TOUR TOKYO 2025』が開催されます!データ活用の最前線を是非体感しに来てください!是非会場でお会いしましょう! はじめに最近、AI エージェントによる開発支援がますます注目を集めていますね。その中でも Model Context Protocol (MCP) という標準化されたプロトコルが Anthropic 社から発表され、様々なツールや API と LLM をより簡単に接続できるようにな...
2日前

AWSのService Quotas引き上げ
Zennの「LLM」のフィード

情報が錯綜しており、最新のURLがどこかよくわからない。なにが正しいのかどんどんわからなくなる。ので備忘録。LLMをEC2スポットインスタンス上で使いたくて、GPUが欲しくなった。権限を確認したら、サービスクォータの上限が足りなかったのでサポートへ連絡した。 問い合わせてみたI want to increase my service quotaみたいなシンプルなsubjectにしたところ、サービスクォータのコンソールからリクエストしてね、と言われる。返信まで3〜5日ほどだった。サービスクォータ引き上げのお願いURL:https://console.aws.amazon.co...
2日前

契約書を“意思決定のインフラ”に──Contract Oneで挑む、新たな価値創造
Sansan Tech Blog

こんにちは、Contract One Engineering Unitの大島です。 このたび、Contract One Engineering Unitの立ち上げに伴い、部長としてジョインしました。これまで私は研究開発部の部長として、また時にはSansan Engineering Unitの副部長として非構造化データを構造化し、意味のあるデータとして活用するための技術開発に取り組んできました。 そんな私が次に挑むのが、「契約書の未来をつくること」です。このチャレンジに至った経緯について説明させてください。
3日前

非エンジニアもMarkdownでテストを書ける — PlaywrightとGaugeによる自動テスト
エムスリーテックブログ

はじめに エムスリーテクノロジーズの永江 (@yukinagae)です。 2025年7月からエムスリーテクノロジーズに入社し、グループ会社への技術支援をしています。詳しい業務内容は、前回の記事でも紹介しました。 支援内容は、各グループ会社の状況や参画するエンジニアのスキルによって変わりますが、共通してCI/CDの強化から始めることが多いです。なかでも特に自動テストの強化は、最初に手がけるべき施策だと考えています。 その理由は、次の3つです。 導入ハードルが低い: 既存のコードに影響を与えずに導入できる 既存コードの理解が深まる: テストを書く過程で自然とコードの動きやドメイン知識が身につく 成…
3日前

生成AIの利活用事例に関するLT会を開催しました! LINEヤフー Tech Blog (LY Corporation Tech Blog
8月13日に紀尾井町オフィスにて、生成AI利活用事例に関するLT会「Hacking Fest 2025 Summer」を開催しました。当日はオフライン・オンライン合わせて多くの方にご参加いただき、20...
3日前

初学者向け~シリコンバレー・コンピューティング・ファクトリー物語~絶対に忘れないGPUの仕組み
Zennの「LLM」のフィード

〜GPU王国の秘密を解き明かす冒険〜 プロローグ:二つの工場の物語昔々、シリコンバレーには二つの有名な工場がありました。CPUマンション株式会社 - 少数精鋭の高級住宅メーカー社長:セントラル・プロセッサー(通称:CPU社長)特徴:4〜32人の超優秀なエンジニアが、複雑な設計を丁寧に一軒ずつ手がけるモットー:「質の高い仕事を、順番に、確実に」GPUメガファクトリー株式会社 - 大規模量産型製造業社長:グラフィック・パラレル・ユニット(通称:GPU社長)特徴:数千人〜数万人の作業員が、同じ作業を一斉に行うモットー:「みんなで協力すれば、不可能はない!」今...
3日前

AWS Strands Agents Multiagent Graph 試してみた
Zennの「LLM」のフィード

はじめにFusicのレオナです。今回は、Strands AgentsのMultiagent Graph機能を使ってみました。 Strands AgentsとはStrands Agentsは、AWSが2025年5月に公開したオープンソースのAIエージェント構築SDKで、2025年7月にバージョン1.0がリリースされました。数行のPythonコードでAIエージェントを作成できるモデル駆動型のフレームワークです。ベータ版のStrands Agentsについて執筆した以下のブログも参考にしてください。https://zenn.dev/fusic/articles/8dd670c3...
3日前

諦めかけた技術負債返済を3カ月で完遂させた2つの決断 - Epoxy48個削除の軌跡
Sansan Tech Blog

はじめに こんにちは!技術本部 Sansan Engineering Unit Mobile Applicationグループの桑原です。 このたび、Mobileチームでは「技術負債返済」をテーマとしたTech Blogリレー企画を開始することになりました。 本記事はその第一弾として、Epoxy削除プロジェクトを取り上げます。今後も隔週でMobileチームから技術負債返済に関する記事を投稿予定ですので、ぜひご期待ください。 さて、技術負債、溜まっていませんか?「いつかやろう」「時間ができたらやろう」と思いながら、気づけば半年、1年と放置してしまう。そんな経験をお持ちの方も多いのではないでしょうか…
3日前

AIに得意かどうかはユニットテストが書きやすいかどうかで判別できる
きしだのHatena

AIコーディングエージェントが100倍速くなるエントリに、10000tok/secとTDDとがあればコーディングはガチャになるというブックマークコメントがありました。 AIコーディングエージェントは100倍速くなる - きしだのHatena LLMはじめとした機械学習は、よりよいランダムを選ぶ仕組みです。当たりのランダムが出る確率が高くなるようにパラメータの調整を行うことを「学習」と呼んでいます。こんな感じで、「学習」が進むとハズレが減っていくわけですね。この確率が安定したところが、学習の終了です。 (ChatGPTにでっちあげてもらったイメージ画像) 答えが定義できれば、その答えが出るランダ…
3日前

AI駆動開発ツール:コーディングエージェントとTextToAppまとめ(2025年9月版)
Publickey

アプリケーション開発の生産性向上において、AIによるプログラミング支援ツールやサービスは欠かせないものになろうとしていますが、一方でこの分野にはさまざまなベンダから新製品やサービスが続々と投入され続けており、その全体像を把握するのが難しくな...
3日前

AI駆動開発ツール:コーディングアシスタントツールまとめ(2025年9月版)
Publickey

アプリケーション開発の生産性向上において、AIによるプログラミング支援ツールやサービスは欠かせないものになろうとしていますが、一方でこの分野にはさまざまなベンダから新製品やサービスが続々と投入され続けており、その全体像を把握するのが難しくな...
3日前

エンティティリンキングの性能改善のための効果的な絞り込み手法の検証
TECH BLOG | 株式会社AI Shift

はじめまして!一橋大学SDS研究科 修士1年の佐藤祥太 (@Shota_Sato01) です。今回私は8月のCA Tech JOBインターンに参加させていただきました! この記事では、配属先のAI Shiftでの取り組み […]投稿 エンティティリンキングの性能改善のための効果的な絞り込み手法の検証 は 株式会社AI Shift に最初に表示されました。
3日前
8/31 (日)

Learning web development: JSON and processing files in Node.js
2ality – JavaScript and more

<p>In this chapter, we explore the popular data format <em>JSON</em>. And we implement shell commands via Node.js that read and write files.</p>
4日前

Claude Opus 4.1 and Opus 4 degraded quality Simon Willison's Weblog
<p><strong><a href="https://status.anthropic.com/incidents/h26lykctfnsz">Claude Opus 4.1 and Opus 4 degraded quality</a></strong></p>Notable because often when people complain of degraded model quality it turns out to be unfounded - Anthropic in the past have emphasized that they don't change the model weights after releasing them without changing the version number.</p><p>In this case a botched upgrade of their inference stack cause a genuine mod...
4日前
8/30 (土)

Quoting Benj Edwards Simon Willison's Weblog
<blockquote cite="https://arstechnica.com/information-technology/2025/08/the-personhood-trap-how-ai-fakes-human-personality/"><p>LLMs are intelligence without agency—what we might call "vox sine persona": voice without person. Not the voice of someone, not even the collective voice of many someones, but a voice emanating from no one at all.</p></blockquote><p class="cite">&mdash; <a href="https://arstechnica.com/information-technology/2025/08/the-personhood-...
4日前

AIプログラムの開発演習に使う低消費リソースローカルLLMはQwen3 1.7B Q4がベスト
きしだのHatena

AIプログラムの開発、つまり、AIにコードを書かせるのではなくて、LLMを呼び出したりRAGを実装したりエージェントを作ったりといったAIを組み込むプログラミングの演習をしたいときに、参加者のPCに十分なリソースを前提とできないことは多いと思います。 Java AIプログラミング記事でQwen3 1.7B Q4_K_Mを選んだ 先月gihyo.jpの連載で、「JavaでAIプログラミングをはじめよう」という記事を出しました。 「JavaでAIプログラミングをはじめよう」という短期連載をgihyo.jpで出しました - きしだのHatena そのときに、読者のPCにGPUが載ってたりMacである…
5日前

Learning web development: JavaScript Maps
2ality – JavaScript and more

<p>In this chapter, we’ll explore the data structure <code>Map</code> (a class) which lets us translate (“map”) from an input value to an output value. We’ll use a Map to display text upside-down in a terminal!</p>
5日前

Talk Python: Celebrating Django's 20th Birthday With Its Creators Simon Willison's Weblog
<p><strong><a href="https://talkpython.fm/episodes/show/518/celebrating-djangos-20th-birthday-with-its-creators">Talk Python: Celebrating Django&#x27;s 20th Birthday With Its Creators</a></strong></p>I recorded this podcast episode recently to celebrate Django's 20th birthday with Adrian Holovaty, Will Vincent, Jeff Triplet, and Thibaud Colas.</p><blockquote><p>We didn’t know that it was a web framework. We thought it was a tool for buil...
5日前

The perils of vibe coding Simon Willison's Weblog
<p><strong><a href="https://www.ft.com/content/5b3d410a-6e02-41ad-9e0a-c2e4d672ca00">The perils of vibe coding</a></strong></p>I was interviewed by Elaine Moore for this opinion piece in the Financial Times, which ended up in the print edition of the paper too! I picked up a copy yesterday:</p><p><a href="https://static.simonwillison.net/static/2025/ft.jpeg" style="text-decoration: none; border-bottom: none"><img src="https://static.simon...
5日前

Wallet-Draining npm Package Impersonates Nodemailer to Hijack Crypto Transactions
Socket

Malicious npm package impersonates Nodemailer and drains wallets by hijacking crypto transactions across multiple blockchains.
5日前
8/29 (金)

Lossy encyclopedia Simon Willison's Weblog
<p>Since I love collecting questionable analogies for LLMs, here's a new one I just came up with: an LLM is <strong>a lossy encyclopedia</strong>. They have a huge array of facts compressed into them but that compression is lossy (see also <a href="https://www.newyorker.com/tech/annals-of-technology/chatgpt-is-a-blurry-jpeg-of-the-web">Ted Chiang</a>).</p><p>The key thing is to develop an intuition for questions it can usefully answer vs questions that ...
5日前

博士課程からビジネスの世界へ。「本質を追求する力」を企業で活かす
Platinum Data Blog by BrainPad ブレインパッド

博士課程出身者のキャリアと聞くと、どのようなイメージを抱くでしょうか? 大学に残って研究者となることだけが進路ではなく、研究活動を通じて得られたスキルや思考力はビジネスの世界でも役に立ちます。データ活用を通じて企業の課題解決や自社プロダクトの開発を手がけるブレインパッドには、アカデミアの経験を存分に活かせるフィールドが広がっています。今回はさまざまなポジションで活躍する博士課程出身者4名に集まってもらい、ビジネスへの転身を決断してブレインパッドを選んだ理由や、研究で培った力がどのように仕事に役立っているのかを語ってもらいました。金 俊亨 馬場 はるか 森 遥 佐藤 洋行 株式会社BrainPad AAA アナリティクスコンサルティングユニット アナリティクスコンサルティングユニット 執行役員トランスフォーメーションユニット ユニット統括ディレクター 多様な研究分野からブレインパッドへ集う── まずは、自己紹介と博士課程で取り組んでいた研究内容を教えてください。佐藤馬場金 森アカデミアの世界からビジネスへ── 熱意をもって研究に取り組まれていたなかで、企業への就職を考えるようになったきっ
5日前

開発メンバーからEMが誕生するまで
株式会社ログラス テックブログのフィード

!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprintの106週目の記事です!この記事で2年間連続達成となりました!🎉🎉🎉🎉🎉ログラスのよしだです。猛暑日が続きすぎて、毎日暑さと格闘しております。皆様も暑さには引き続きご注意ください。 はじめに今回は、開発メンバーの一人がEMになるまでのストーリーと、その道のりを伴走したマネージャー視点(私)での学びを共有しようと思います。弊社では、EM候補の外部採用もしていますが内部登用も行っております。私自身もキャリアに悩みがあり入社直後はエンジニアでしたが途中でEMになっておりますので、改...
5日前

日本の医療に本気で向き合う。認証・権限管理基盤チームの決意
KAKEHASHI Tech Blog

医療業界全体を支え、日本の未来を変えていく──。 そんな壮大なビジョンを掲げ、少数精鋭で取り組むスペシャリスト集団がカケハシの認証・権限管理基盤チームです。 今回は認証・権限管理基盤チームから、PdMの渡部桂太、エンジニアの岩佐幸翠に話を聞きました。チームの成り立ち、日々の業務といった基本的なお話から、認証・権限管理基盤チームが描く未来まで、広く、そして深く語りました。彼らの本気をぜひ感じてください。 認証・権限管理基盤チームの役割 認証・権限管理基盤チーム エンジニア 岩佐 幸翠 — まず認証・権限管理基盤チームが立ち上がった経緯から教えてください 岩佐:はい、創業時までさかのぼって説明しま…
6日前

Design Marathon: Enhancing collaboration and AI-utilization in just an hour
Sansan Tech Blog

I held a "Design Marathon" with my team to push our technical abilities, enhance collaboration, and utilize AI in ways we weren't used to, and I think your team should do the same (or similar). My Team My name Jose (but I usually go by "King"), and I am a founding member of team Haraya, the first gl…
6日前

Learning web development: JavaScript exceptions
2ality – JavaScript and more

<p>In this chapter, we look at <em>exceptions</em> in JavaScript. They are a way of handling errors. We’ll need them for the next chapter.</p>
6日前

JavaScript’s trademark problem
2ality – JavaScript and more

<p>In this blog post, we discuss Oracle’s trademark of the word “JavaScript”:</p><ul><li>What are the problems caused by that trademark?</li><li>How can we fix those problems?</li></ul>
6日前

Python: The Documentary Simon Willison's Weblog
<p><strong><a href="https://youtu.be/GfH4QL4VqJ0">Python: The Documentary</a></strong></p>New documentary about the origins of the Python programming language - 84 minutes long, built around extensive interviews with Guido van Rossum and others who were there at the start and during the subsequent journey. <p>Tags: <a href="https://simonwillison.net/tags/computer-history">computer-history</a>, <a href="https://simonwillison.net/tags/guido...
6日前

Risky Biz Podcast: Making Reachability Analysis Work in Real-World Codebases
Socket

This episode explores the hard problem of reachability analysis, from static analysis limits to handling dynamic languages and massive dependency trees.
6日前
8/28 (木)

Working with Contexts
Radar

The following article comes from two blog posts by Drew Breunig: “How Long Contexts Fail” and “How to Fix Your Contexts.” Managing Your Context Is the Key to Successful Agents As frontier model context windows continue to grow,1 with many supporting up to 1 million tokens, I see many excited discussions about how long-context windows […]
6日前

Introducing gpt-realtime and Realtime API updates
OpenAI News

We’re releasing a more advanced speech-to-speech model and new API capabilities including MCP server support, image input, and SIP phone calling support.
6日前

大規模同義語辞書でElasticsearchのIndex作成が重くなる問題とその対策
Sansan Tech Blog

こんにちは。技術本部 Contract One Engineering Unit の伊藤です。Sansan株式会社で AI 契約データベース「Contract One」の開発を担当しています。Contract Oneでは契約書検索をコア機能として提供していますが、実運用では社名の表記揺れや新旧社名による検索漏れが課題となっていました。たとえば「さんさん」と入力しても「Sansan株式会社」にヒットしてほしいですし、旧社名「三三株式会社」を検索しても新社名に紐づく契約書がヒットするようになって欲しいという要望がありました。そこでElasticsearchの同義語検索機能を導入し、複数の表記を吸収…
6日前

Supporting nonprofit and community innovation
OpenAI News

OpenAI launches a $50M People-First AI Fund to help U.S. nonprofits scale impact with AI. Applications open Sept 8–Oct 8, 2025 for grants in education, healthcare, research, and more.
6日前

テストを実行して、Sorbetのsigを自動生成する
Sansan Tech Blog

こんにちは。 名刺アプリ「Eight」でエンジニアをしている鳥山(@pvcresin)です。 先日、スポーツサンダルで炎天下を散歩したのですが、日焼けで足の甲がシマウマみたいになってしまいました。 足にも日焼け止め塗った方が良いかもしれません。 さて今回は、RSpecのテストコードを元にRubyのメソッドの型(sig)を自動生成した話をしたいと思います。 ※ 本記事はOmotesando.rb#112での発表資料を元に加筆修正したものです。
7日前

メルマガ配信基盤のバウンスメール発生率を60%減らした話
エムスリーテックブログ

はじめまして。4月にQLife(エムスリーグループ会社)に中途入社した安田(@Quarter_st)です。主に社内向けのメルマガ配信基盤の開発に携わっております。 バウンスメールはメール送信に失敗すると送信先サーバからenvelope-fromに返されるメールです。 弊社のメルマガ配信基盤で使用しているエムスリーのメールサーバの信頼性を下げないためにもバウンスメールの発生率を下げておきたいです。 今回は、そんなバウンスメールの発生理由を可視化し、発生理由が二度と相手に届かない類のものである場合は該当アドレスを送信対象から除外し、バウンスメール発生率を低下させた話をご紹介します。 はじめに バウ…
7日前

組織の一体感を育み、テキストだけでは伝わらない温度感を届ける。社内ポッドキャスト開始しました
KAKEHASHI Tech Blog

こんにちは、技術広報の櫛井です。普段は@941というHNでインターネットで活動しています。 カケハシの開発組織で技術系の情報発信や登壇支援、イベントスポンサー窓口など技術に関わる各種企画を担当しています。最近はこのKAKEHASHI Tech Blogの更新をもっと盛り上げようと取り組んでおり、おかげさまで更新頻度をグイッとあげることが出来はじめました。今後も技術発信を活発にしていきたいと思っていますのでご期待ください。 さて今回は、社内向けにポッドキャスト番組を開始したので、なぜ・どうやって・どうなったかをご紹介しようと思います。 なぜポッドキャストなのか Googleが提供するNotebo…
7日前

Learning web development: Plain objects in JavaScript
2ality – JavaScript and more

<p>In this chapter, we learn how to create <em>plain objects</em> with properties. We use them to create a simple flash card app.</p>
7日前

V&A East Storehouse and Operation Mincemeat in London Simon Willison's Weblog
<p>We were back in London for a few days and yesterday had a day of culture.</p><p>First up: the brand new <a href="https://www.vam.ac.uk/east/storehouse/visit">V&amp;A East Storehouse</a> museum in the Queen Elizabeth Olympic Park near Stratford, which opened on May 31st this year.</p><p>This is a delightful new format for a museum. The building is primarily an off-site storage area for London's Victoria and Albert museum, storing 250,000 items tha...
7日前

Quoting Bruce Schneier Simon Willison's Weblog
<blockquote cite="https://www.schneier.com/blog/archives/2025/08/we-are-still-unable-to-secure-llms-from-malicious-inputs.html"><p>We simply don’t know to defend against these attacks. We have zero agentic AI systems that are secure against these attacks. Any AI that is working in an adversarial environment—and by this I mean that it may encounter untrusted training data or input—is vulnerable to prompt injection. It’s an existential problem that, near as I can tell, most people dev...
7日前

How Google’s AI can help transform health professions education
The latest research from Google

Education Innovation
7日前

Nx npm Packages Compromised in Supply Chain Attack Weaponizing AI CLI Tools
Socket

Malicious Nx npm versions stole secrets and wallet info using AI CLI tools; Socket’s AI scanner detected the supply chain attack and flagged the malware.
7日前

国内クラウド市場、2024年は9兆7000億円。5年後には約2倍の19兆2000億円規模に。IDC Japan
Publickey

調査会社のIDC Japanは国内クラウド市場予測を発表しました。発表によると昨年(2024年)の国内クラウド市場は売上額ベースで、前年比29.2%増の9兆7084億円。 これが年平均14.6%成長により5年後の2029年には約2倍の19兆...
7日前