# Machine_Learning ACL 2022 Review 올해로 60회를 맞은 Annual Meeting of the Association for Computational Linguistics (ACL)는 자연어 처리 분야 최고의 국제 컨퍼런스로서 최신 NLP 연구들이 발표되는 행사입니다. 엔데믹 상황으로 접어들면서 올해 ACL은 오프라인과 온라인에서... 이주홍 | 2022년 06월 16일
# Machine_Learning # Engineering Apache Beam으로 머신러닝 데이터 파이프라인 구축하기 2편 - 개발 및 최적화 지난 글에서는 핑퐁팀이 어떻게 Apache Beam을 도입하였는지를 설명드렸어요! 이번 글에서는 본격적으로 유지보수성을 높이면서 어떻게 머신러닝 데이터 파이프라인을 개발하였는지 차근차근 설명해 드릴게요. 😄 김성환, 홍승환 | 2022년 06월 09일
# Engineering 개발자를 위한 AWS 클라우드 보안 (2) - 로깅 및 모니터링과 데이터 보호 지난 글에 이어 이번 글에서는 로깅 및 모니터링 영역과 데이터 보호 영역에 대해 살펴보겠습니다. 이성찬, 김성훈 | 2022년 06월 03일
# Machine_Learning # Engineering Apache Beam으로 머신러닝 데이터 파이프라인 구축하기 1편 - 도입과 사용 핑퐁팀은 Apache Beam을 사용하여 사용자 데이터의 가명처리, 대규모 데이터 정제, 임베딩 벡터를 사용한 데이터 샘플링과 TFRecord 변환에 이르는 다양한 작업을 처리하고 있습니다. 핑퐁팀이 왜 Apache Beam을 사용하는지, 어떻게 사용하는지 자세하게... 홍승환, 김성환 | 2022년 05월 25일
# Machine_Learning 알라꿍달라꿍의 대화요약 이모저모 저(박상준), 최기원, 오혜린 셋은 작년에 열렸던 2021 한국어 음성·자연어 인공지능 경진대회에 함께 팀을 이뤄 대화요약 부문에 참가했습니다. 회사에서 공식적으로 참가한 건 아니지만 자주 보면서 이야기를 나눠야 하다 보니 자연스레 회사... 박상준 | 2022년 05월 25일
# Engineering 개발자를 위한 AWS 클라우드 보안 (1) - 클라우드 설계 원칙과 IAM 스캐터랩에서는 루다를 비롯한 회사의 서비스를 배포하고 운영하기 위해 AWS를 사용하고 있습니다. 컴퓨팅, 네트워크 장비를 직접 구매해서 모든 것을 세팅할 필요 없이, 클라우드에서 인프라 구축, 자동 스케일링, 네트워크, DNS 구성 등을... 이성찬 | 2022년 05월 13일
# Machine_Learning # Engineering TensorFlow Custom Op으로 데이터 변환 최적화하기 핑퐁팀에서는 모델 학습의 효율성을 위해 자주 TFRecord를 생성합니다. 하지만 정제할 데이터가 많은 경우에는 변환이 느려지고, 속도 최적화가 필요합니다. 이 때의 병목점을 Custom Op으로 교체하면 처리 속도를 매우 빠르게 만들 수... 정욱재, 홍승환 | 2021년 01월 06일
# Machine_Learning # Engineering 하나의 조직에서 TensorFlow와 PyTorch 동시 활용하기 보통 제품이 있는 조직은 TensorFlow를, 리서치 조직은 PyTorch를 활용하는 것이 좋다고 알려져 있습니다. 그리고 하나의 조직에서는 하나의 프레임워크만 사용하는 것이 일반적이죠. 하지만 핑퐁팀의 형태는 다소 특이합니다. TensorFlow와 PyTorch를 동시에 사용하고... 정욱재 | 2020년 12월 04일
# Machine_Learning # Engineering 딥러닝 모델 서비스 A-Z 2편 - Knowledge Distillation 핑퐁팀이 내부적으로 활용하는 대형 언어 모델은 실제 서비스화하기에는 연산량이 많고, 많은 메모리를 요구합니다. 이런 모델을 실제로 활용하기 위해서는 잘 알려진 경량화 기법을 적용해야 하는데, 그 중 가장 대표적인 Knowledge Distillation... 정욱재, 홍승환, 박상준 | 2020년 11월 18일
# Machine_Learning EMNLP 2020 프리뷰 Conference on Empirical Methods in Natural Language Processing (EMNLP)은 자연어 처리(NLP) 분야를 주도하는 국제 컨퍼런스 중 하나로 매년 많은 NLP 연구자들이 주목하는 학회입니다. 올해 EMNLP는 COVID-19로 인해서 온라인 형식으로 진행됩니다.... 고상민, 구상준, 김준성, 서상우, 이주홍, 장성보, 정다운 | 2020년 11월 11일