์ด ๋ ํฌ์งํ ๋ฆฌ๋ ์นด์นด์คํก ์๋ ์๋ต์ ํด์ค๋๋ค.
์ด์ ๊ท์ฐฎ์ ์นดํก์ VLM ์๊ฒ ๋งก๊ธฐ์ธ์.
์ฑํ ์ฐฝ์ ์ด๋ฏธ์ง๋ก ์ฒ๋ฆฌํ๊ธฐ ๋๋ฌธ์ ์ด๋ฏธ์ง๋ ์ด๋ชจํฐ์ฝ์ ๋์์ค๋ ํ์ ํ ์ ์์ต๋๋ค.
Note
๋งฅ๋ถ์ cmd+shift+4 ๋ฅผ ํตํด ์ขํ๋ฅผ ์ฝ๊ฒ ํ์ธํ ์ ์์ต๋๋ค. left-top์ ์์น๋ฅผ ํ์ธํ๊ณ , ๋๋๊ทธ๋ฅผ ํตํด width์ height๋ฅผ ํ์ธํ์ธ์.
1. ์ฐ์ ์๋์ ๊ฐ์ด ํ๊ฒฝ๋ณ์๋ฅผ ์ค์ ํด์ค๋๋ค.
touch .env
echo "OPENAI_API_KEY={PUT YOUR OPENAI KEY HERE}" > .env
echo "ANTHROPIC_API_KEY={PUT YOUR ANTHROPIC KEY HERE}" > .env2. requirements.txt ๊ฐ ์ ๊ณต๋์ง ์์ผ๋ ํจํค์ง๋ฅผ ์ ์ ํ ๋ค์ด ๋ฐ์์ฃผ์ธ์.
3. config.json ์ ๊ณ ์ณ์ฃผ์ธ์. 16์ธ์น ๋งฅ๋ถ์ด๋ฉด ์นดํก์ฐฝ์ ์ผ์ชฝ ๋ฐ์ ์ ์์น์ํค๋ฉด ์๋ฐ๊ฟ๋ ๋ฉ๋๋ค.
monitor_region๋ ๋ค์๊ณผ ๊ฐ์ด ์๊ฒผ์ด์ผ ํฉ๋๋ค.- ๋์ ์ธ ์ด๋ชจํฐ์ฝ์ด๋ ์ด๋ฏธ์ง์ ๋์ํ๊ธฐ ์ํด ํ๋กํ ์ฌ์ง์ ์์น ๋ณํ๋ง ๊ฐ์งํฉ๋๋ค.
capture_region๋ ๋ค์๊ณผ ๊ฐ์ด ์๊ฒผ์ด์ผ ํฉ๋๋ค.- ์ฑํ ์ฐฝ ์ ์ฒด๊ฐ ์ฐํ์ผํฉ๋๋ค.
input_coords๋ ์ฑํ ์ ๋ ฅ์นธ ์๋ฌด๋ฐ๋์ ์ขํ๋ฅผ ๋ฃ์ด์ฃผ์๋ฉด ๋ฉ๋๋ค.
3. ํ์ด์ฌ ํ์ผ์ ์คํํด์ฃผ์ธ์.
python multithread_reply.py- ์๋ํ์ง ์์์.
- (์๋ง) ๋งฅ ํ๊ฒฝ์์๋ง ์๋ํฉ๋๋ค. ๋งฅ ํ๊ฒฝ์ธ์ง ํ์ธํด์ฃผ์ธ์.
- off-the-shelf OCR tool ์ด๋ cv tool ์ ์จ์ ๊ฐ์ ํ ์ ์์ ๊ฒ ๊ฐ์์.
- ์ด ํ๋ก์ ํธ๋ VLM ์ ๊ฐ๋ ฅํจ์ ํ ์คํธ ํ๊ธฐ ์ํด ์์ฑ๋์์ต๋๋ค.
- ์ด์ ๋ฐ๋ผ hand-crafted ํ ๋ถ๋ถ์ ์ค์ด๊ณ VLM ์ ๋ ๋ง์ ์ญํ ์ ๋ถ์ฌํ๋ ๊ฒ์ด ๋ชฉํ์ ๋๋ค.
- ์ฝ๋๋ฅผ ๊ฐ์ ํ๊ณ ์ถ์ด์.
- ํ๋ฆฌํ์คํธ๋ฅผ ํ์ํฉ๋๋ค.


