이번 주 인공지능 소식 #15/2025: 메타가 무너지고 클로드가 승리하고 OpenAI가 마침내 문을 열었을 때

Meta의 폭발적인 드라마, OpenAI의 충격적인 투명성, 그리고 AGI까지 불과 몇 달이 걸리는 개발. 이번 주에는 인공지능에 대해 알아보겠습니다.

이번 주 AI 뉴스를 놓치셨다면, 한 가지만 알려드리겠습니다. 민트 그녀는 (다시) 무릎을 꿇었고, 클로드는 사무실의 책임자가 되었습니다. OpenAI 마침내 오픈 소스를 받아들이고 있으며, 구글은 사용자보다 비디오를 더 잘 편집할 수 있는 인공 슈퍼 비서에 대한 비전을 개발하고 있습니다. 이건 농담이 아닙니다. 이번 주 인공지능 15호입니다.

이번 주 인공지능 #15:
메타와 라마 4 재앙

라마 4는 메타 AI 개발의 정점에 도달할 것으로 기대되었지만, 최종 결과는 실망스러웠습니다. 대중에게 선보인 모델은 벤치마크에 참여해 감명을 준 모델이 아니었습니다. 이 사실을 처음으로 발견한 사람은 이선 몰릭 교수로, 그는 LLM-arena에 게재된 모델의 결과가 공개 버전의 결과와 일치하지 않는다는 것을 확인했습니다. (출처: x.com/ethanmollick)

이후 Reddit에 현재 OpenAI에서 근무하는 전 Meta 직원들이 게시글을 올려 Llama 4와의 거리를 공개적으로 드러냈습니다. 그중 한 명은 자신의 프로필에 "Llama 2, Llama 3, Llama 4? 저는 아무 상관이 없습니다."라고 적었습니다. (출처: reddit.com)

또한, 메타의 AI 부서가 벤치마크에서 알려지지 않은 저예산 중국 모델인 DeepSeek V3에 추월당하자 내부 개편이 이루어졌다는 정보가 나왔습니다. 인공지능 개발에 수십억 달러를 투자하는 회사에게 이는 결코 쉬운 일이 아닙니다.

클로드 맥스와 클로드 4에 대한 예측

Anthropic은 이번 주에 새로운 서비스로 놀라움을 선사했습니다. 클로드 맥스 – 까다로운 사용자를 위한 구독 플랜으로, 상호작용 할당량의 5~20배, 최신 모델 및 기능에 대한 우선 액세스 권한을 제공합니다. (출처: anthropic.com)

한편, Anthropic의 수석 과학자인 재러드 카플란은 앞으로 6개월 안에 클로드 4를 볼 수 있을 것이라고 발표했습니다. 그에 따르면, AI 모델의 개발은 하드웨어 개발보다 빠르게 진행되고 있으며, 이는 주로 가속화된 사후 학습과 강화 학습의 개선에 기인합니다. 이번 주 인공지능 분야에서 미묘하지만 중요한 뉴스 중 하나가 나왔습니다.

OpenAI가 마침내 오픈소스 모델을 발표

투명성 부족과 원래 사명과의 거리두기로 인해 수년간 비판을 받아온 OpenAI가 기존의 모든 대안보다 성능이 뛰어난 오픈소스 모델을 곧 출시할 것이라고 샘 알트먼이 발표했습니다. (출처: openai.com)

게다가 ChatGPT에는 이제 장기 메모리 기능이 있어 과거 상호작용을 사용하여 경험을 개인화할 수 있으며, 사용자는 AI가 자신의 목표를 적극적으로 추적하고 생각 패턴의 불일치를 해소하도록 안내받을 수 있습니다.

하지만 모든 것이 그렇게 밝은 것은 아닙니다. OpenAI의 간략한 보안 테스트

파이낸셜 타임즈 OpenAI가 모델의 보안을 테스트하는 데 걸리는 시간과 범위를 크게 줄였다는 사실이 밝혀졌습니다. 몇 주가 걸리던 것이 이제는 며칠로 줄었고, 이로 인해 발견되지 않은 취약점이 있는 모델이 대중에 공개될 수 있다는 우려가 제기되었습니다. 한 전직 테스트 엔지니어는 FT에 GPT-4의 위험성이 출시 후 불과 두 달 만에 발견되었다고 말했습니다. (출처: ft.com)

그 이유는 간단하다. 경쟁 압력 때문이다. 기업들은 뒤처지지 않기 위해 새로운 모델을 도입하는 데 서두르고 있습니다. 이것들이 우리 시대의 가장 강력한 도구임에도 불구하고, 보안은 주변부로 밀려나고 있습니다.

DeepCode 14B: OpenAI의 오픈소스 경쟁자

DeepSeek와 Aentica가 발표되었습니다. 딥코드 14B, 소프트웨어 코드를 생성하기 위한 오픈 소스 모델입니다. 매개변수는 단 140억 개에 불과하지만, 상용 GPT-3.5 모델과 비슷한 결과를 달성합니다. 그들은 24,000개 이상의 고유한 작업으로 모델을 훈련시켰고, 완벽한 솔루션에 대해서만 모델에 보상을 제공하는 GRPO+ 방법을 사용했습니다. (출처: github.com/aentica)

BrowseComp: AI 에이전트를 위한 새로운 리그

OpenAI가 도입했습니다 브라우즈컴프웹을 효율적으로 탐색하고 복잡한 정보를 검색할 수 있는 AI 에이전트를 위한 벤치마크입니다. 이는 관련 정보를 얻기 위해 수십 개의 페이지를 탐색해야 하는 모델을 테스트하기 위한 것입니다. (출처: github.com/openai/simple-evals)

구글이 이 게임을 선도하고 있습니다

구글, 합병 계획 공개 쌍둥이 자리 그리고 비오 모델 - 텍스트, 이미지, 오디오 이해와 비디오 생성. 그들의 목표는 우리처럼 세상을 이해하는 다중 모드 슈퍼 비서를 만드는 것입니다. (출처: googlecloudnext.com)

Suno AI: 음악 산업을 '점령한' 앱, 그리고 그것이 일부에게는 좋은 소식이지만 다른 일부에게는 정말 나쁜 소식인 이유

또한 구글은 새로운 세대의 AI 칩을 출시했습니다. TPU 아이언우드이는 2018년의 1세대 모델보다 3600배 더 강력합니다. 이를 통해 Nvidia에 의존하지 않고도 더 큰 모델을 훈련하고 더 빠르게 실행할 수 있습니다.

Microsoft Copilot이 심각한 경쟁자가 되고 있습니다.

마이크로소프트의 부조종사 새롭게 디자인된 인터페이스, 아파트 검색 기능, 편지 쓰기 지원, 심지어 이미지 편집 기능까지 제공합니다. 화면과 상황에 접근할 수 있어 실시간 개인 비서 역할을 합니다. (출처: microsoft.com)

마이크로소프트 AI 책임자인 무스타파 술레이만은 AGI가 5년 안에 실현될 수 있다고 믿지만, 환각과 지시 따르기 어려움과 같은 기본적인 문제는 아직 해결되지 않았다고 인정합니다.

Midjourney v7: 멋진 이미지, 하지만 여전히 텍스트 없음

Midjourney는 극도로 사실적인 표현으로 인상적인 7세대 이미징 모델을 출시했습니다. 하지만 텍스트 생성은 여전히 크게 뒤처져 있습니다. 사용자들이 텍스트 생성을 거의 사용하지 않기 때문에 우선순위가 낮기 때문입니다. (출처: midjourney.com)

라이브로 작동하는 네오 로봇

로봇 플랫폼 1X 네오 그녀는 독립적으로 실시간 작업을 수행할 수 있음을 보여주었습니다. 이것은 단순한 홍보 행위가 아닙니다. 로봇은 스크립트 없이 움직이고, 청소하고, 작동했습니다. 이 로봇의 디자인에는 인간과 안전하게 공존할 수 있도록 인공 근육과 이동성이 포함되어 있습니다. (출처: 1x.tech)

AI 과학자, 첫 전문 논문 작성

사카나 AI 랩은 그들의 모델이 워크숍에서 동료 평가를 통과한 최초의 과학 논문을 작성했다고 발표했습니다. AI는 인간의 도움 없이 가설을 세우고, 데이터를 분석하고, 결론을 도출했습니다. (출처: sakana.ai)

결론

단 1주일 만에 우리는 Meta 비전의 붕괴, 오픈 소스 모델의 가속화, 보안 테스트의 위험한 추세, 그리고 새로운 세대의 멀티모달 에이전트를 목격했습니다. 인공지능의 세계는 급속도로 진화하고 있을 뿐만 아니라, 불과 1년 전만 해도 공상과학에 나올 법한 방향으로 진화하고 있습니다.

다음 주에는 더 많은 일이 있을 것으로 기대됩니다. 뭔가 놓친 게 있다면, 우리가 여기에 있을게요. 매주 월요일.

이번 주 인공지능 #15/2025: 메타가 무너지고 클로드가 승리하고 OpenAI가 마침내 문을 열었을 때

이번 주 인공지능 #15: 메타와 라마 4 재앙