딥러닝 (3) 썸네일형 리스트형 Secrets of RLHF in Large Language Models Part I: PPO Paper: https://arxiv.org/abs/2307.04964v1 AI-generated Summary 대규모 언어 모델(LLM)은 인간 중심의 비서를 만드는 것을 목표로 하는 인공 지능 개발에서 중요한 구성 요소로 자리 잡았습니다. 인간 피드백을 통한 강화 학습(RLHF)은 인간과의 조율을 달성하기 위한 핵심 기술 패러다임입니다. 하지만 몇 가지 한계와 해결해야 할 과제가 있습니다. 한 가지 한계는 모델 크기와 데이터 규모가 RLHF 성능에 미치는 영향이 철저하게 조사되지 않았기 때문에 스케일링 법칙(Scaling Law)입니다. 현재 연구는 70억 개의 매개변수 모델에 초점을 맞추고 있지만, 다양한 크기와 규모가 RLHF에 어떤 영향을 미치는지 이해하기 위해서는 추가 연구가 필요합니다. 또 .. Nvidia RTX 30 시리즈 출시! 한국시간으로 9월 2일 새벽 1시에 Nvidia의 새로운 RTX 아키텍쳐 Ampere에 기반한 그래픽카드 3종을 새로 발표했습니다. 여러 가지 변화점들도 있고 그래픽카드 외에도 새로 발표한 내용들이 더 있지만, 관심이 가는 부분만 중점적으로 정말 주관적으로 발표를 해석해보겠습니다! 1. 90 라인업의 등장2018년 8월에 공개된 바로 전세대 라인업인 20 라인업의 발표 때는, 2080 Ti, 2080, 2070이 발표 되었습니다. 하지만 이번에는 3090, 3080, 3070을 발표했는데요. 90 라인업이 나올것이라는 의견은 출시 전부터 많이 루머로 있던 내용이지만, 실제로 이 90 라인업이 기존의 Ti 라인업을 대체하여 더 높은 성능을 강조하는 네이밍이 되는 것인지, 아니면 추후에 Ti 라인업을 따로 .. Nvidia Jetson Nano 구매! 항상 그래왔듯이, 뭔가를 계획하면 거기에 관련된 것들을 할 생각보다 주변 기기부터 사버리곤 한다. 이번에도 그랬다..! 홀린듯이 Jetson Nano를 질러버린 나를 발견했다. 일단, 자세한 보드에 대한 스펙은 다음의 링크에 나와있다. https://www.nvidia.com/ko-kr/autonomous-machines/embedded-systems/jetson-nano/ 수백 만대의 디바이스에 AI 성능을 불어넣다. NVIDIA Jetson Nano는 수백만 대의 저비용 저전력의 소형 AI 디바이스 개발을 가능케 합니다. www.nvidia.com 간단하게 설명을 하자면, AI의 부상으로(+블록체인, 비트코인) 엄청 떠버린 Nvidia에서 만든 SBC(Single Board Computer)이다. 이.. 이전 1 다음