본문 바로가기
반응형

grok3

20260519, My AI Agent Performance Update 어제 Github를 서칭하던 중, 꽤 흥미로운 Repository를 발견했다. AI Agent의 Hallucination 을 제거하고 이전 작업들에 대한 기억력을 높여 실수를 범하지 않도록 작업명령에 대한 추론과 실행 구조를 쳬계화하는 것이었다. 우선은 Claude를 사용해서 Instructions을 생성했고Grok, Gemini, Chatgpt에 맞춰 Instructions를 수정, 등록해 보았다. 아... 덤으로 한 가지 더,해당 Repository는 Token의 사용수도 획기적으로 줄여준다고 한다. 어제 새롭게 업데이트한 Instructions을 적용해 보았는데...움... 아직 잘 모르겠다. ㅋ 다만, Claude 사용량 초과했다는 메시지는 오늘 하루동안 보지 못했다. 기존의 Instruc.. 2026. 5. 21.
Mechanical Engineer가 비전공자 관점에서 읽어 본 DeepSeek-R1 Paper Review - 02 난 AI분야를 전공했거나 Computer Science를 공부하진 않았지만 대학에서 Mechanical Engineering을 배웠고 그 지식을 이용해서 삶을 살아가고 있는 평범한 공학 엔지니어이다.  "Mechanical Engineer가 비전공자 관점에서 읽어 본 DeepSeek-V3 Paper Review - 01"에 이은 두 번째 DeepSeek 논문 리뷰글이다.  1. 서론: 왜 강화학습으로 추론능력을 키우는가?   ○ 최근 대규모 언어모델(LLM)은 급속한 발전을 거듭하며 인간수준의 지능에 점점 더 가까워지고 있음   ○ 특히, 사후학습(Post-training)은 LLM의 성능을 더욱 끌어올리는 중요한 단계로 주목받고 있음. 사후학습은 모델이 사회적 가치에 부합하고 사용자의 선호도에 맞게 조.. 2025. 3. 7.
Mechanical Engineer가 비전공자 관점에서 읽어 본 DeepSeek-V3 Paper Review - 01 난 AI분야를 전공했거나 Computer Science를 공부하진 않았지만 대학에서 Mechanical Engineering을 배웠고 그 지식을 이용해서 삶을 살아가고 있는 평범한 공학 엔지니어이다.  요즘 시대는 AI를 몰라서도 안되고 사용할 줄 모르면 안되는 AI가 보편적인 세상으로 점점 변해가고 있다. 아직은 나도 내 주업무를 해나가는데 직접적으로 AI를 많이 사용하고 있지 않지만 어느 순간부터는 AI를 매우 잘 다뤄야 하고 매일, 매시간을 같이 일하게 될지도 모를 일이다. 그래서 적을 알고자(?) 비록 전공자는 아니지만 AI가 어떤 것인지는 이해하고자 최근 전세계적으로 큰 관심을 받고 있는 DeepSeek 논문 2편을 읽고 내 나름대로 요약해 보았다. DeepSeek 논문이 AI의 생김새를 꽤 세.. 2025. 3. 7.
반응형