Intellij - LLM 연동하기: 모델 다운로드

2025. 5. 21. 17:38·Data Engineering/Infra
728x90
반응형

개요

인텔리제이와 LLM을 연동하려면 Proxy AI라는 플러그인을 사용한다. 이 플러그인은 대화형을 지원하기 때문에 AI 모델도 대화형이 지원되는 걸 다운로드해야 한다. 모델 이름에 Instruct 가 붙어 있는 게 대화형을 지원하는 모델이다. 대화형을 지원 안 하는 모델도 사용 가능하지만 벽에다 대고 말하는 것 같은 기분이 드니까 처음부터 Instruct 가 붙어 있는 모델을 다운로드 하자.

 

허깅페이스에서 CodeLlama-34B-Instruct-GGUF 모델을 다운로드 받았다.

  • CodeLlama: 모델명
  • 34B: 모델 파라미터 수 (340 억)
  • Instruct: 대화형 지원
  • GGUF: 경량 파일 포맷 (로컬 환경에서도 빠르게 실행할 수 있음)

https://huggingface.co/TheBloke/CodeLlama-34B-Instruct-GGUF

 

TheBloke/CodeLlama-34B-Instruct-GGUF · Hugging Face

CodeLlama 34B Instruct - GGUF Description This repo contains GGUF format model files for Meta's CodeLlama 34B Instruct. About GGUF GGUF is a new format introduced by the llama.cpp team on August 21st 2023. It is a replacement for GGML, which is no longer s

huggingface.co

 

이 모델을 선택한 이유는 첫 번째, Meta 가 만들었다는 점. 두 번째, 코드 생성 모델들을 비교한 지표들을 확인했을 때 상위권에 있다는 점. 세 번째, 다운로드 수가 가장 많은 점. CodeLlama보다 우위에 있는 신규 모델들도 있었다. 다만 유저들의 데이터가 가장 많았고, 메타에 대한 믿음(?)으로 업데이트도 주기적으로 이루어질 것 같아 해당 모델을 선택했다.

 

모델 선택 시 고려한 점

  1. 주기적으로 업데이트 되는가
  2. 신뢰성이 있는 모델인가
  3. 한글 질문을 잘 이해하는가

 

728x90
반응형
저작자표시 비영리 변경금지 (새창열림)

'Data Engineering > Infra' 카테고리의 다른 글

서버 DISK FULL 이 발생했다 (장애 발생 시 대응 기록)  (0) 2025.02.18
nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)  (0) 2024.09.02
[Redis] 레디스 큐 목록 조회하는 법  (0) 2024.07.08
[Jupyter Notebook] failed to load config section "notebook" 해결 방법  (0) 2024.06.28
[Jupyter Notebook] nbextensions 설치하기  (0) 2024.06.28
'Data Engineering/Infra' 카테고리의 다른 글
  • 서버 DISK FULL 이 발생했다 (장애 발생 시 대응 기록)
  • nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)
  • [Redis] 레디스 큐 목록 조회하는 법
  • [Jupyter Notebook] failed to load config section "notebook" 해결 방법
Jaeyeon-Choi
Jaeyeon-Choi
데이터 엔지니어 호소인의 시행착오
    반응형
  • Jaeyeon-Choi
    데엔데엔
    Jaeyeon-Choi
  • 전체
    오늘
    어제
    • 분류 전체보기 (50) N
      • Python (6)
      • Data Engineering (20)
        • Airflow (3)
        • Spark (5)
        • Infra (6)
        • ElasticSearch (1)
        • Hive (3)
        • etc (1)
      • Docker · Git (11)
      • Study (5)
        • SQL (5)
      • CS (1)
        • 운영체제 (0)
        • 네트워크 (1)
        • 알고리즘 (0)
        • 데이터베이스 (0)
      • 주간 · 월간 회고 (6) N
      • 생각 (1)
        • 기타 (1)
        • 뉴스 (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    SQL
    hive
    데이터엔지니어
    하이브
    엔진엑스
    이미지
    데이터타입
    Oracle
    파이썬
    nbextensions
    Python
    Spark
    스파크
    폐쇄망
    도커
    컨테이너
    docker
    nginx
    Airflow
    주피터노트북
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.2
Jaeyeon-Choi
Intellij - LLM 연동하기: 모델 다운로드
상단으로

티스토리툴바