IBM, Granite Speech 4.1 2B 및 비자동회귀 트윈 — 기업용으로 구축된 소형 ASR 모델 출시 IBM이 두 개의 Granite Speech 4.1 2B 모델 출시: 번역 기능이 포함된 자동회귀 ASR…
최신 갱신 상태
마지막 갱신: 2026. 4. 30. AM 10:15
IBM, Granite Speech 4.1 2B 및 비자동회귀 트윈 — 기업용으로 구축된 소형 ASR 모델 출시 IBM이 두 개의 Granite Speech 4.1 2B 모델 출시: 번역 기능이 포함된 자동회귀 ASR…
Cursor, 개발자가 프로그래밍 방식 코딩 에이전트를 구축 및 배포할 수 있도록 TypeScript SDK 출시 포스트 Cursor는 샌드박스 클라우드 VM을 사용하여 프로그래밍 방식 코딩 에이전트를 구축하기 위한 TypeScript SDK를 소개합니다…
arXiv:2604.26091v1 발표 유형: new 개요: 우리는 실제 자본 하에서 사용자 명령을 검증된 도구 작업으로 변환하는 자율 언어 모델 에이전트의 신뢰성을 연구합니다. 설정은 DX...
arXiv:2604.26095v1 발표 유형: new 개요: {폐쇄 루프 역 소스 위치 파악 및 특성화(ISLC)를 위해서는 모바일 에이전트가 소스 위치를 파악하고 위치를 추론하는 측정값을 선택해야 합니다.
arXiv:2604.26106v1 발표 유형: new 개요: 예측 벤치마크는 정확도 순위표를 생성하지만 일부 예측자가 다른 예측자보다 더 정확한 이유에 대한 통찰력은 거의 없습니다. 벤치를 소개합니다…
arXiv:2604.26120v1 발표 유형: new 개요: 행동 로그는 사용자 모델링을 위한 풍부한 신호를 제공하지만 잡음이 많고 다양한 의도에 걸쳐 인터리브됩니다. 최근 연구에서는 LLM을 사용하여 해석을 생성합니다.
arXiv:2604.26211v1 발표 유형: new 개요: AI 연구를 자동화하기 위해 우리는 완전한 엔드 투 엔드 프레임워크인 OMEGA: 생성된 알고리즘을 평가하여 기계 학습 최적화를 도입합니다.
arXiv:2604.26233v1 발표 유형: new 개요: LLM(대형 언어 모델)은 다양한 사법 및 행정 분야에 걸쳐 법적 의사 결정 보조자 및 최초의 의사 결정자로 제안됩니다.
arXiv:2604.26237v1 발표 유형: new Abstract: 본 연구는 수학 과외에서 학습된 무기력(LH)과 관련된 행동 상호작용 패턴을 분석하기 위해 Apriori 알고리즘을 적용했습니다.
arXiv:2604.26311v1 발표 유형: new 개요: "wake-sleep" 프로그램 유도 패러다임을 활용하여 형식 정리에 대한 재사용 가능한 보조정리를 발견하는 에이전트 프레임워크인 DreamProver를 소개합니다.
arXiv:2604.26507v1 발표 유형: new 개요: 배경 및 목표: 지난 10년 동안 기계 학습 연구는 빠르게 성장했지만 대형 모델은 소프트 한계에 도달하여 이를 입증하고 있습니다.
arXiv:2604.26521v1 발표 유형: new 개요: 구성 일반화는 현대 신경망의 근본적인 약점으로 남아 있으며, 이를 요구하는 영역에서의 견고성과 적용성을 제한합니다.
arXiv:2604.26522v1 발표 유형: new 개요: LLM(대형 언어 모델) 기반 에이전트는 구성 일반화에서 시스템적 오류를 나타내며 대화형 환경에서 견고성이 제한됩니다...
arXiv:2604.26577v1 발표 유형: new 개요: 대형 언어 모델(LLM)은 로봇 의료진의 제어 구성 요소로 배포하는 것이 점점 더 고려되고 있지만, 이 분야에서의 안전성은…
arXiv:2604.26607v1 발표 유형: new 개요: 역량 기반 교육(CBE)이 전 세계적으로 인기를 끌면서 점수 기반 평가에서 질적 역량 매핑으로의 전환이 중요해졌습니다.
arXiv:2604.26644v1 발표 유형: new 개요: LRM(대형 추론 모델)은 수학적 추론 작업에서 강력한 성능을 달성하지만 까다로운 인스턴스에서는 여전히 불안정합니다. 기존 테스트 -…
arXiv:2604.26645v1 발표 유형: new 개요: AI-for-Science(AI4Science)는 기계 학습 모델을 예측, 시뮬레이션 및 최면에 내장하여 과학적 발견을 점점 더 변화시키고 있습니다.
arXiv:2604.26733v1 발표 유형: new 개요: 실시간 미래 예측은 실제 사건이 전개되기 전에 이를 예측하는 작업을 의미합니다. 이 작업은 lar를 사용하여 점점 더 연구되고 있습니다.
arXiv:2604.26805v1 발표 유형: new 개요: 대규모 온라인 엔진 시스템(검색, 추천, 광고)을 운영 및 유지(O&M)하려면 출시 이후 상당한 인적 노력이 필요합니다.
arXiv:2604.24966v1 발표 유형: 십자가 개요: 선두 AI 기업은 먼저 내부적으로 가장 진보된 모델을 배포하기 전에 몇 주 또는 몇 달 동안 안전 테스트, 평가 및 반복을 수행합니다.
arXiv:2604.25920v1 발표 유형: 십자가 개요: 강력한 언어 기능에도 불구하고 LLM(대형 언어 모델)은 계산량이 많고 정밀한 작업을 위해 상당한 리소스가 필요합니다.
arXiv:2604.25922v1 발표 유형: 십자가 개요: 우리는 25개 이상의 제공업체가 제공하는 115개 대규모 언어 모델에 대한 의식 거부 행동을 측정하는 체계적인 벤치마크인 DenialBench를 제시합니다. 사용…
AI와 로봇을 구축하려면 인프라가 필요하지만 인프라를 구축하려면 AI와 로봇도 필요한 것 같습니다.
기사 URL: https://burrito.bio/essays/biology-is-a-burrito 댓글 URL: https://news.ycombinator.com/item?id=47957714 포인트: 101 # 댓글: 13
기사 URL: https://openai.com/index/where-the-goblins-came-from/ 댓글 URL: https://news.ycombinator.com/item?id=47957688 포인트: 624 # 댓글: 337
기사 URL: https://github.com/cauchy221/Alignment-Whack-a-Mole-Code 댓글 URL: https://news.ycombinator.com/item?id=47957627 포인트: 134 # 댓글: 103
기사 URL: https://pure-systems.org/posts/2026-04-29-function-programmers-need-to-take-a-look-at-zig.html 댓글 URL: https://news.ycombinator.com/item?id=47957624 포인트: 122 # 댓글: 90
기사 URL: https://simonwillison.net/2026/Apr/30/zig-anti-ai/ 댓글 URL: https://news.ycombinator.com/item?id=47957294 포인트: 287 # 댓글: 124
기사 URL: https://www.jcvi.org/media-center/j-craig-venter-genomics-pioneer-and-founder-jcvi-and-diploid-genomics-inc-dies-79 댓글 URL: https://news.ycombinator.com/item?id=47957101 포인트: 117…
전자상거래 거대 기업인 AWS는 예상보다 많은 돈을 AWS에서 벌고 있지만 지출도 많이 하고 있으며 단기적으로는 계속해서 그렇게 할 것이라고 최고경영자(CEO)가 말했습니다.
이 문제에 정통한 소식통에 따르면 Claude의 제조사는 8,500억 달러에서 9,000억 달러 범위의 가치 평가로 여러 차례 선제 제안을 받았습니다.
Elon Musk는 OpenAI를 합법적으로 해체하려는 시도로 이틀째 입장을 취했습니다.
Meta는 매 분기마다 Reality Labs에서 수십억 달러의 손실을 입고 있으며, AI 지출은 지출을 증가시킬 뿐입니다.
Microsoft는 OpenAI의 기술을 클라우드 고객에게 제공하게 되며 이에 대한 비용을 지불할 필요가 없습니다. Nadella는 "우리는 이를 완전히 활용할 계획입니다."라고 말했습니다.
실제로 Copilot을 사용하는 사람이 없다는 인식이 계속 남아 있음에도 불구하고 Microsoft는 수요일에 사용자 수와 참여도가 증가하고 있다고 밝혔습니다.
Google Cloud는 AI에 대한 수요 급증에 힘입어 처음으로 분기별 매출 200억 달러를 돌파했습니다. 그러나 용량 제약으로 인해 더 빠르게 성장할 수도 있었습니다.
AI 모델에서 고블린 출력이 확산되는 방식: 타임라인, 근본 원인, GPT-5 행동의 성격 중심 기이함 뒤에 있는 수정 사항.
기사 URL: https://opentrafficmap.org/ 댓글 URL: https://news.ycombinator.com/item?id=47953541 포인트: 169 # 댓글: 36
LLM 추론을 위한 상위 10개 KV 캐시 압축 기술: 제거, 양자화 및 낮은 순위 방법 전반에 걸쳐 메모리 오버헤드 줄이기 LLM 추론을 위한 사후 상위 10KV 캐시 압축 기술…
기사 URL: https://github.com/anthropics/claude-code/issues/53262 댓글 URL: https://news.ycombinator.com/item?id=47952722 포인트: 1020 # 댓글: 438
기사 URL: https://copy.fail/ 댓글 URL: https://news.ycombinator.com/item?id=47952181 포인트: 689 # 댓글: 285
QwenLM 팀은 GDN(Gated Delta Network) 청크 프리필(Chunked Prefill)의 정방향 및 역방향 패스를 획기적으로 가속화하는 새로운 커널 라이브러리인 FlashQLA를 출시했습니다.
기사 URL: https://lawsofux.com/ 댓글 URL: https://news.ycombinator.com/item?id=47951137 포인트: 212 # 댓글: 31
이 튜토리얼에서는 OpenAI 개인정보 보호 필터를 사용하여 개인 식별 정보를 탐지하고 수정하기 위한 완전한 프로덕션 스타일 파이프라인을 구축합니다. 환경을 설정하는 것부터 시작합니다…
OpenAI는 Stargate를 확장하여 AGI를 지원하는 컴퓨팅 인프라를 구축하고 증가하는 AI 수요를 충족하기 위해 새로운 데이터 센터 용량을 추가합니다.
NeuralSet 소개: 신경과학과 AI를 연결하는 Meta의 간단하고 빠르며 확장 가능한 Python 패키지 Meta FAIR에서 NeuralSet 출시: fMRI, M/EEG를 지원하는 Neuro-AI용 Python 패키지…
smol-audio는 오디오 AI 요리책 실무자들이 기다려온 게시물 smol-audio: Whisper, Parakeet, Voxtral, Granite Speech 및 오디오를 미세 조정하기 위한 Colab 친화적인 노트북 컬렉션…
이 튜토리얼에서는 ParseBench 데이터세트를 사용하여 체계적이고 실용적인 방식으로 문서 구문 분석 시스템을 평가하는 방법을 살펴봅니다. 먼저 Hugging Face에서 데이터세트를 직접 로드하고 검사합니다.
풀사이드에서 Laguna XS.2 및 M.1 출시: 장거리 작업을 위해 구축된 개방형 에이전트 코딩 모델 포스트 풀사이드 AI가 Laguna XS.2 및 M.1 소개: 에이전트 코딩 모델 68.2% 및 72.5…
OpenAI는 AI 기반 사이버 방어를 민주화하고 중요 시스템을 보호하는 데 중점을 두고 지능 시대의 사이버 보안을 강화하기 위한 5개 부분으로 구성된 실행 계획을 설명합니다.
이 튜토리얼에서는 Colab 환경 내에서 Promptflow를 사용하여 완전한 프로덕션 스타일 LLM 워크플로를 구축합니다. 먼저 OS 종속성 문제를 방지하고 보안을 유지하기 위해 안정적인 키링 백엔드를 설정합니다.
Google 번역 로고는 실시간 대화를 번역하는 사람들과 숫자 20이 적힌 촛불이 얹힌 생일 케이크 등 다채로운 그림 장면 가운데 자리잡고 있습니다.
OpenAI가 모델 보호, 오용 감지, 정책 시행 및 안전 전문가와의 협업을 통해 ChatGPT에서 커뮤니티 안전을 어떻게 보호하는지 알아보세요.
이제 OpenAI GPT 모델, Codex 및 관리형 에이전트를 AWS에서 사용할 수 있으므로 기업은 AWS 환경에서 안전한 AI를 구축할 수 있습니다.
수년간의 법적 불화 끝에 Elon Musk와 OpenAI CEO Sam Altman은 이번 주 북부 캘리포니아에서 엄청난 결과를 초래할 수 있는 사건에 대한 재판을 앞두고 있습니다. OpenAI의 높은 기대를 앞두고…
이 이야기는 원래 AI에 관한 주간 뉴스레터인 The Algorithm에 게재되었습니다. 받은편지함에서 이와 같은 뉴스를 먼저 받으려면 여기에서 가입하세요. 지난 2월 런던에서 열린 반AI 행진에서 전단지를 주웠는데…
OpenAI는 ChatGPT Enterprise 및 OpenAI API에 대해 FedRAMP 중간 인증을 통해 제공되므로 미국 연방 기관의 안전한 AI 채택이 가능합니다.
인공 지능이 이사회 안건을 지배하고 있을 수 있지만, 많은 기업에서는 의미 있는 채택을 가로막는 가장 큰 장애물이 데이터 상태라는 사실을 깨닫고 있습니다. 소비자를 향한 AI…
OpenAI와 Microsoft는 파트너십을 단순화하고 장기적인 명확성을 추가하며 대규모의 지속적인 AI 혁신을 지원하는 수정된 계약을 발표했습니다.
Codex 오케스트레이션을 위한 오픈 소스 사양인 Symphony가 이슈 추적기를 상시 에이전트 시스템으로 전환하여 엔지니어링 결과를 향상하고 컨텍스트 전환을 줄이는 방법을 알아보세요.
Choco가 OpenAI API를 사용하여 식품 유통을 간소화하고 생산성을 높이며 성장을 촉진한 방법 - 실제 AI가 미치는 영향에 대한 심층적인 고객 사례입니다.
우리의 임무는 AGI가 모든 인류에게 혜택을 줄 수 있도록 하는 것입니다. Sam Altman은 우리 업무의 지침이 되는 5가지 원칙을 공유합니다.
금요일, 중국 AI 회사 DeepSeek는 오랫동안 기다려온 새로운 플래그십 모델인 V4의 미리보기를 공개했습니다. 특히 이 모델은 새로운 디자인 덕분에 이전 세대보다 훨씬 긴 프롬프트를 처리할 수 있습니다.
문서 및 이메일 아이콘이 스트리밍되는 노트북, 휴대폰을 들고 체크리스트를 보고 웃고 있는 사람, Gemini Live를 활성화하는 사용자 등의 그림이 포함된 검은색 화면
이 새로운 동영상을 통해 Google의 TPU가 점점 더 까다로워지는 AI 워크로드를 어떻게 지원하는지 알아보세요.
8세대 Google TPU에는 AI의 미래를 뒷받침할 특수 칩 2개가 포함되어 있습니다.
인공 지능은 실험에서 일상적인 사용에 이르기까지 기업 내에서 빠르게 움직이고 있습니다. 조직은 재무, 공급망, 비즈니스 전반에 걸쳐 부조종사, 에이전트 및 예측 시스템을 배포하고 있습니다.
ChatGPT가 2022년 말 실험적 프로토타입으로 출시되었을 때 OpenAI의 챗봇은 수억 명의 사람들을 위한 일상적인 모든 앱이 되었습니다. ChatGPT와 같은 LLM은 새로운 미래였습니다. 전체…
ChatGPT는 2022년 말 대중에게 공개되었을 때 생성 AI가 간단한 프롬프트에서 사람처럼 보이는 방대한 양의 텍스트를 얼마나 쉽게 대량으로 생성할 수 있는지에 대한 사람들의 눈을 뜨게 했습니다. 이것은 빨리 잡았습니다…
Google Marketing Live로 가는 길 그래픽 2026년 5월 20일 오전 9시(태평양 표준시) 다채로운 아래쪽 그라데이션이 있는 흰색 배경입니다.
해변 마을의 물가 농산물 직판장에서 Pixel 휴대전화를 들고 있는 사람을 보여주는 그림