본문 바로가기
배움: MBA, English, 운동

Claude 3.5 출시 - Sonnet

by Heedong-Kim 2024. 6. 22.

오늘 우리는 곧 출시될 Claude 3.5 모델 패밀리의 첫 번째 버전인 Claude 3.5 Sonnet을 출시합니다. Claude 3.5 Sonnet은 업계 기준을 높이며, 다양한 평가에서 경쟁 모델 및 Claude 3 Opus를 능가하며, 중간 등급 모델인 Claude 3 Sonnet의 속도와 비용을 제공합니다.

 

Claude 3.5 Sonnet은 현재 Claude.ai와 Claude iOS 앱에서 무료로 사용할 수 있으며, Claude Pro 및 팀 플랜 구독자는 훨씬 높은 사용 한도로 접근할 수 있습니다. 또한, Anthropic API, Amazon Bedrock 및 Google Cloud의 Vertex AI를 통해서도 사용할 수 있습니다. 모델 비용은 백만 입력 토큰당 3달러, 백만 출력 토큰당 15달러이며, 200K 토큰 컨텍스트 윈도우를 제공합니다.

 

https://claude.ai/

 

 

최고 속도의 프론티어 인텔리전스

Claude 3.5 Sonnet은 대학원 수준의 추론(GPQA), 학부 수준의 지식(MMLU), 코딩 숙련도(HumanEval)에서 새로운 업계 벤치마크를 설정합니다. 이 모델은 뉘앙스, 유머 및 복잡한 지시사항을 이해하는 능력이 현저히 향상되었으며, 자연스럽고 공감 가는 톤으로 고품질 콘텐츠를 작성하는 데 탁월합니다.

 

Claude 3.5 Sonnet은 Claude 3 Opus보다 두 배 빠른 속도로 작동합니다. 이 성능 향상과 비용 효율적인 가격이 결합되어 Claude 3.5 Sonnet은 상황에 민감한 고객 지원 및 다중 단계 워크플로우 조정과 같은 복잡한 작업에 이상적입니다.

 

내부 에이전틱 코딩 평가에서 Claude 3.5 Sonnet은 문제의 64%를 해결하여 38%를 해결한 Claude 3 Opus를 능가했습니다. 우리의 평가는 모델이 자연어로 설명된 개선 사항을 기반으로 오픈 소스 코드베이스의 버그를 수정하거나 기능을 추가할 수 있는 능력을 테스트합니다. 지시를 받고 관련 도구가 제공되면 Claude 3.5 Sonnet은 독립적으로 코드 작성, 편집 및 실행을 수행하며, 정교한 추론 및 문제 해결 능력을 보여줍니다. 코드 번역도 쉽게 처리하여, 레거시 애플리케이션 업데이트 및 코드베이스 마이그레이션에 특히 효과적입니다.

 

 

최첨단 비전

 

Claude 3.5 Sonnet은 표준 비전 벤치마크에서 Claude 3 Opus를 능가하는 우리의 가장 강력한 비전 모델입니다. 이러한 단계적 개선은 차트 및 그래프 해석과 같은 시각적 추론이 필요한 작업에서 가장 두드러집니다. Claude 3.5 Sonnet은 불완전한 이미지에서 텍스트를 정확하게 전사할 수 있으며, 이는 AI가 이미지, 그래픽 또는 일러스트레이션에서 텍스트만으로는 얻을 수 없는 더 많은 통찰력을 얻을 수 있는 소매, 물류 및 금융 서비스에서 핵심 기능입니다.

 

https://youtu.be/dhxrHvgXpSM

 

 

Prompts
---
Hey Claude! I'm giving a lecture to my class on the human genome. 
Here is a timeline of genome sequencing milestones and a graph of how much it costs to sequence over time. 

Can you transcribe the data into JSON? 


---
Lovely. I'd like you to combine the data from the charts into a single interactive ploty.js chart that allows you to hover over each data point to read more about the milestones. 

Let's use these colors too!


---
Looks fantastic. Let's create a JS-based presentation on this topic. I want to use it in my class today! Please use the chart you just made on one of the slides. 

---




Artifacts—Claude 사용의 새로운 방식

 

오늘 우리는 Claude.ai에서 사용자가 Claude와 상호 작용할 수 있는 방식을 확장하는 새로운 기능인 Artifacts를 도입합니다. 사용자가 코드 스니펫, 텍스트 문서 또는 웹사이트 디자인과 같은 콘텐츠 생성을 Claude에게 요청하면 이러한 Artifacts는 대화와 함께 전용 창에 나타납니다. 이는 사용자가 Claude의 창작물을 실시간으로 보고, 편집하고, 프로젝트 및 워크플로우에 AI 생성 콘텐츠를 원활하게 통합할 수 있는 동적 작업 공간을 만듭니다.

 

이 프리뷰 기능은 Claude의 진화를 대화형 AI에서 협업 작업 환경으로 표시합니다. 이는 Claude.ai의 광범위한 비전의 시작에 불과하며, 곧 팀 협업을 지원하기 위해 확장될 것입니다. 가까운 미래에는 팀, 그리고 궁극적으로 전체 조직이 하나의 공유 공간에서 지식, 문서 및 진행 중인 작업을 안전하게 중앙 집중화할 수 있으며, Claude는 온디맨드 팀원으로 역할을 수행할 것입니다.

 

https://youtu.be/rHqk0ZGb6qo

 

 

Prompts

---
Hey Claude, can you create an 8-bit style crab for me? 



---
Crustaceous. Can you make some seashells in the same style?


---
Shell yeah. How about some clouds? 

---
Love it. Let's inline these into a simple side-scrolling game. HTML5?


---
I love it. Let's make it playable? Have the crab jump up and over oncoming seashells. Maybe add some styling too. 
I think I want to call this crab... Claw'd. 


---

 

 

안전 및 개인정보 보호에 대한 약속

 

우리의 모델은 엄격한 테스트를 거쳤으며 오용을 줄이도록 훈련되었습니다. Claude 3.5 Sonnet의 지능 향상에도 불구하고, 우리의 레드 팀 평가 결과 Claude 3.5 Sonnet은 ASL-2에 남아 있습니다. 자세한 내용은 모델 카드 부록에서 확인할 수 있습니다.

 

안전 및 투명성에 대한 우리의 약속의 일환으로, 우리는 외부 전문가와 협력하여 최신 모델의 안전 메커니즘을 테스트하고 개선했습니다. 최근 우리는 Claude 3.5 Sonnet을 영국 인공지능 안전 연구소(UK AISI)에 제공하여 배포 전 안전 평가를 받았습니다. UK AISI는 3.5 Sonnet의 테스트를 완료하고 그 결과를 미국 AI 안전 연구소(US AISI)와 공유했으며, 이는 올해 초 발표된 미국 및 영국 AISI 간의 파트너십에 의해 가능해진 양해각서의 일환입니다.

 

우리는 외부 주제 전문가의 정책 피드백을 통합하여 우리의 평가가 견고하며 남용의 새로운 트렌드를 고려하도록 보장했습니다. 이러한 참여는 우리의 팀이 3.5 Sonnet을 다양한 유형의 오용에 대해 평가할 수 있는 능력을 확장하는 데 도움이 되었습니다. 예를 들어, 우리는 Thorn의 아동 안전 전문가로부터 받은 피드백을 사용하여 우리의 분류기를 업데이트하고 모델을 미세 조정했습니다.

 

AI 모델 개발을 이끄는 핵심 헌법 원칙 중 하나는 개인정보 보호입니다. 우리는 사용자가 명시적으로 허락하지 않는 한 사용자 제출 데이터를 사용하여 생성 모델을 훈련하지 않습니다. 현재까지 우리는 고객 또는 사용자 제출 데이터를 사용하여 생성 모델을 훈련하지 않았습니다.

 

 

곧 출시 예정

 

우리는 몇 달마다 지능, 속도 및 비용 간의 트레이드오프 곡선을 크게 개선하는 것을 목표로 하고 있습니다. Claude 3.5 모델 패밀리를 완성하기 위해 올해 말 Claude 3.5 Haiku 및 Claude 3.5 Opus를 출시할 예정입니다.

 

다음 세대 모델 패밀리를 개발하는 것 외에도, 우리는 비즈니스용으로 더 많은 사용 사례를 지원하기 위해 새로운 모달리티 및 기능을 개발하고 있습니다. 여기에는 엔터프라이즈 애플리케이션과의 통합이 포함됩니다. 또한 사용자의 선호도 및 상호 작용 기록을 기억하도록 Claude를 설정하여 경험을 더욱 개인화하고 효율적으로 만드는 Memory와 같은 기능을 탐구하고 있습니다.

 

우리는 Claude를 지속적으로 개선하기 위해 노력하고 있으며 사용자로부터의 피드백을 환영합니다. Claude 3.5 Sonnet에 대한 피드백을 제품 내에서 직접 제출하여 우리의 개발 로드맵에 반영하고 사용자 경험을 개선하는 데 도움이 될 수 있습니다. 항상 그렇듯이 Claude를 통해 무엇을 구축하고, 창작하며, 발견할지 기대하고 있습니다.

 

 

 

https://www.anthropic.com/news/claude-3-5-sonnet