<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Opentelemetry on man.hwangsehyun.com</title>
    <link>https://man.hwangsehyun.com/tags/opentelemetry/</link>
    <description>Recent content in Opentelemetry on man.hwangsehyun.com</description>
    <image>
      <title>man.hwangsehyun.com</title>
      <url>https://man.hwangsehyun.com/images/papermod-cover.png</url>
      <link>https://man.hwangsehyun.com/images/papermod-cover.png</link>
    </image>
    <generator>Hugo -- 0.145.0</generator>
    <language>kr</language>
    <lastBuildDate>Thu, 19 Sep 2024 00:00:00 +0900</lastBuildDate>
    <atom:link href="https://man.hwangsehyun.com/tags/opentelemetry/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Basic LLM Ops in AWS</title>
      <link>https://man.hwangsehyun.com/posts/llm-ops-in-aws/</link>
      <pubDate>Thu, 19 Sep 2024 00:00:00 +0900</pubDate>
      <guid>https://man.hwangsehyun.com/posts/llm-ops-in-aws/</guid>
      <description>&lt;h2 id=&#34;background&#34;&gt;Background&lt;/h2&gt;
&lt;p&gt;
  &lt;img
    loading=&#34;lazy&#34;
    src=&#34;https://upload.wikimedia.org/wikipedia/commons/8/82/Las_Vegas_slot_machines.jpg&#34;
    alt=&#34;Row of digital-based slot machines inside a casino in Las Vegas&#34;
    
  /&gt;







&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Row of digital-based slot machines inside a casino in Las Vegas: &lt;a
  href=&#34;https://en.wikipedia.org/wiki/Slot_machine#/media/File:Las_Vegas_slot_machines.jpg&#34;
  &gt;Source&lt;/a
&gt;
&lt;/p&gt;&lt;/blockquote&gt;
&lt;p&gt;&lt;a
  href=&#34;https://arxiv.org/abs/2409.05746&#34;
  &gt;LLMs Will Always Hallucinate, and We Need to Live With This&lt;/a
&gt;
. 프롬프트에 수정이 필요할 때, 비관적인 관점에서는 LLM은 슬롯 머신과 같아서 &lt;a
  href=&#34;https://en.wikipedia.org/wiki/Balloon_effect&#34;
  &gt;풍선 효과&lt;/a
&gt;
를 피할 수 없다. 운이 좋으면 안 되던 것이 될 수도 있겠지만, 되던 것이 안 되던 경우도 비일비재했으며, 자연어를 출력하는 LLM의 특성 상 결국 테스트셋 전체를 LLM에 넣어보고 출력을 사람이 검토하는 작업을 정기적으로 수행했다. Batch job을 수행하고 비개발자와 결과를 검토하는 과정에서 개발자들은 엑셀을 읽고 쓰는 일회용 파이썬 코드를 (무수히 많이) 혼자서만 쓰고 폐기했으며, 이 코드는 서비스에서 돌아가는 코드와 입출력이 달라 테스트 결과도 신뢰할 수 없었다. Batch testing은 통과했으나 실제 서비스에서는 체감 성능이 다른 고통스런 경험을 수도 없이 반복하며, 이 비효율을 발본색원할 수 있는 시스템을 AWS 서비스들과 &lt;a
  href=&#34;https://opentelemetry.io/&#34;
  &gt;&lt;em&gt;OpenTelemetry&lt;/em&gt;&lt;/a
&gt;
를 이용해 구축하고 있다.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
