캠브리지 Liquid AI·Insilico, 제약사 내부 인프라용 경량 신약개발 AI 공개…운영비와 데이터 통제에 초점

작성자: Daniel Lee · 03/06/26

캠브리지의 AI 기업 Liquid AI와 AI 신약개발 기업 Insilico Medicine이 3일 제약 연구용 경량 과학 파운데이션 모델 ‘LFM2-2.6B-MMAI’를 공개했다. 두 회사 설명에 따르면 이 모델은 26억 개 파라미터 규모로, 제약사가 분자·실험·타깃 데이터를 외부 클라우드로 옮기지 않고도 사내 인프라에서 운용할 수 있도록 설계됐다.

양사가 강조한 핵심은 단일 체크포인트로 신약개발 초기 여러 업무를 처리할 수 있다는 점이다. 공개 자료에 따르면 이 모델은 ADMET 예측, 다중 조건 분자 최적화, 단백질 타깃 점수화, 기능기 추론, 역합성 제안 등 약물 발굴 초기 단계의 다양한 작업을 포괄하도록 학습됐다. Liquid AI의 효율형 LFM 아키텍처와 Insilico의 ‘MMAI Gym’ 학습 환경을 결합했고, 1,000개가 넘는 제약 벤치마크와 약 1,200억 토큰 규모의 제약 데이터, 200개가 넘는 작업을 활용했다고 회사 측은 밝혔다.

이번 발표는 제약사가 생성형 AI를 도입할 때 자주 부딪히는 운영 조건을 정면으로 다룬 사례로 볼 수 있다. 후보물질 구조, 실험 결과, 타깃 정보처럼 민감한 연구 데이터를 외부 서비스로 보내지 않아도 된다는 점을 전면에 내세웠기 때문이다. 두 회사는 이런 방식이 보안 검토와 데이터 통제 측면의 부담을 줄이면서도, 연구 현장에서 바로 시험해볼 수 있는 배치 형태를 제공하는 데 의미가 있다고 설명했다.

성능 수치 역시 함께 제시됐다. Liquid AI 자료에 따르면 LFM2-2.6B-MMAI는 일부 약동학·독성 예측 과제에서 더 큰 규모의 모델과 비교해 경쟁력 있는 결과를 보였고, 분자 최적화 벤치마크에서는 최대 98.8%의 성공률을 기록했다고 한다. 다만 이런 비교 중 일부는 회사 측이 제시한 내부 또는 자체 구성 벤치마크에 기반해 있어, 실제 연구 현장에서의 효과는 각 조직의 데이터 품질, 검증 절차, 실험 설계, 기존 워크플로와의 통합 수준에 따라 달라질 수 있다.

실무적으로는 도입 방식부터 좁혀 보는 편이 현실적이다. 예를 들어 외부 반출이 어려운 데이터가 많은 조직이라면, 먼저 내부 GPU 서버나 보안 구역에서 파일럿 테스트가 가능한지 확인하는 단계가 필요하다. 그다음에는 ADMET 예측이나 분자 최적화처럼 범위를 한정한 과제에서 정확도와 운영 비용을 함께 비교해 보는 방식이 일반적일 수 있다. 마지막으로 화학·생물·데이터팀의 검토 절차 안에 이 모델 결과를 어떻게 넣을지 정리해야 실제 활용 가능성을 판단할 수 있다.

이번 발표만으로 곧바로 상용 성과를 단정하기는 이르다. 다만 두 회사가 ‘더 큰 모델’ 자체보다도, 제약사가 내부 환경에서 돌릴 수 있는 경량 모델과 데이터 통제 구조를 함께 제시했다는 점은 분명한 메시지다. 화려한 데모보다 배치 환경, 보안, 운영비를 앞세운 접근이라는 점에서, 이번 공개는 신약개발 AI가 연구 현장 적용 단계로 어떻게 조정되고 있는지를 보여주는 사례에 가깝다.

[보스턴 인사이트 뉴스 홈] > [테크·비즈] > [AI]

캠브리지 Liquid AI·Insilico, 제약사 내부 인프라용 경량 신약개발 AI 공개…운영비와 데이터 통제에 초점

댓글 작성

댓글 (0)

관련 기사

같은 카테고리 최신