'분류 전체보기' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (301)

말랑말랑제리스타일

강화 학습에서의 에이전트와 환경: 역할과 상호작용 구조 이해하기

강화 학습은 에이전트가 환경과 상호작용하며 학습해 나가는 구조로 이루어집니다.이 둘의 관계를 명확히 이해하는 것이 전체 흐름을 파악하는 데 매우 중요합니다.이번 글에서는 에이전트(agent)와 환경(environment)이 각각 어떤 역할을 하며,어떻게 상호작용하면서 학습이 이뤄지는지를 살펴보겠습니다.에이전트(Agent)란?에이전트는 행동을 결정하고 보상을 받으며 학습하는 주체입니다.강화 학습에서의 주인공이라고 보면 됩니다.에이전트는 현재 상태(state)를 관찰하고,정책(policy)을 기반으로 행동(action)을 선택한 뒤,그 결과로 보상(reward)을 받습니다.예시자율주행차 시뮬레이션: 자동차가 에이전트게임 AI: 게임 내 플레이어 캐릭터가 에이전트로봇 제어 문제: 팔 움직임을 제어하는 로봇이 ..

프로그래밍/강화학습 2025. 5. 9. 09:42

강화 학습의 구성 요소: 상태, 행동, 보상, 정책, 가치 함수 정리

강화 학습을 이해하려면, 기본이 되는 구성 요소들을 정확하게 알고 있어야 합니다.처음에는 개념이 조금 헷갈릴 수 있지만, 각각이 어떤 역할을 하는지 하나씩 짚어보면 의외로 단순한 구조라는 걸 알 수 있습니다.이번 글에서는 강화 학습을 구성하는 핵심 개념들인 상태(state), 행동(action), 보상(reward), 정책(policy), 가치 함수(value function) 를 정리해봅시다상태(State)상태는 에이전트가 현재 어떤 상황에 있는지를 나타냅니다.예를 들어, 자율주행차라면 현재 속도, 차선 위치, 주변 차량의 위치 등이 하나의 상태가 될 수 있습니다.이 정보들을 바탕으로 에이전트는 어떤 행동을 취할지 결정하게 됩니다.강화학습에서는 주로 상태를 S 또는 St로 표기합니다행동(Action)행..

프로그래밍/강화학습 2025. 5. 9. 09:16

강화 학습이란 무엇인가: 개념과 원리 깊이 이해하기

강화 학습(Reinforcement Learning)은 머신러닝의 한 분야로, 에이전트가 환경과 상호작용하면서 보상을 최대화하는 방향으로 스스로 학습하는 알고리즘입니다. 지도 학습(Supervised Learning)이나 비지도 학습(Unsupervised Learning)과는 전혀 다른 패러다임으로 행동(action)의 결과를 보고 판단하며 학습하는 것이 핵심입니다.강화 학습의 핵심 개념 정리1. 에이전트(Agent)학습을 수행하는 주체입니다. 예를 들어 게임 속 캐릭터나 자율주행 자동차가 에이전트입니다.2. 환경(Environment) 에이전트가 상호작용하는 세계입니다. 예: 바둑판, 도로, 게임 화면 등.3. 상태(State) 에이전트가 인식하는 현재 환경의 정보입니다. 예: 자동차의 속도, 방향,..

프로그래밍/강화학습 2025. 5. 7. 07:55

Pandas apply lambda 함수에서 Key 에러 발생 확인 사항

Pandas dataframe으로 작업을 하다 보면 apply로 lambda 함수를 사용하는 경우가 많은데요사소한 실수로 인해 Key 에러가 발생하는 상황이 있습니다저도 이것 때문에 한참 헤매다가 결국 원인을 찾고 허무했는데요정말 사소한 실수때문에 발생하는 dataframe.apply 함수에서 발생하는 Key 에러 원인과 확인 사항 알려드립니다Pandas apply lambda 함수에서 Key 에러 발생한 원인Pandas apply lambda 함수에서 Key 에러가 발생하고 분명 해당 칼럼이 있는데 Key가 없다고 에러가 나서 많이 답답했는데요알고 보니 별거 아닌 문제였습니다뒤에 axis를 붙여줘야했던건데요import pandas as pdtest_df = pd.DataFrame({ 'CODE':..

프로그래밍/파이썬 2025. 4. 14. 07:47

파이썬 Set 정의 데이터 추가 및 삭제 방법

파이썬의 자료형인 Set을 정의하고 데이터 추가 및 삭제를 비롯해 Set의 여러 메서드 정리파이썬 Set 특징파이썬에서 Set의 특징을 보려면 List와 비교하는 쪽이 가장 이해가 편합니다먼저 List는 데이터의 순서가 있고 들어가는 순서대로 저장이 됩니다대신 Set은 순서랄 게 없기 때문에 index를 통한 접근이 불가하며, 데이터가 들어갈 때 자동으로 정렬을 해주고 중복된 데이터를 제외해 줍니다파이썬에서 Set 정의파이썬에서 Set 정의하는 방법은 2가지가 있습니다set_a = {1,2,3,4}set_b = set()초기 데이터가 있는 Set은 set_a와 같이 중괄호로 묶고 데이터를 넣어줍니다.그러나 초기 데이터가 없는 Set의 중괄호를 비우는 경우 dictionary 타입이 되기 때문에 set_b..

프로그래밍/파이썬 2025. 3. 6. 10:38

파이썬 딥러닝 텐서 플로우, 사이킷 런 등 설치 명령어

파이썬 딥러닝을 하려면 다양한 라이브러리가 필요한데요. 물론 numpy로 일일이 구현이 가능할 수도 있겠지만 우리는 2025년에 살고 있기 때문에 텐서 플로우, 사이킷 런 등 패키지를 적극적으로 이용해 봅시다.텐서플로우 설치 및 import먼저 가장 기본이 되는 텐서플로우 설치 명령어와 import 구문입니다.설치는 pip 명령어로 이렇게 사용할 수 있습니다.pip install tensorflow필요시 pip upgrade가 필요할 건데 생략하겠습니다.이렇게 tensor flow를 설치하면 tensor flow 기본 기능 및 keras 기능까지 모두 사용 가능합니다.그야말로 어마어마한 패키지죠.그만큼 용량도 많이 잡아먹지만 설명은 여기까지 하고 import 구문입니다.from tensorflow.ker..

프로그래밍/딥러닝 2025. 2. 12. 09:23

유니티 6 Universal 2D 프로젝트 안드로이드 빌드 툴 설치

유니티 6 프로젝트를 Universal 2D로 만들어서 실컷 작업을 했는데 안드로이드로 빌드하려니까 External Tools에 안드로이드가 없는 경우 당황하거나 프로젝트를 새로 만들 필요 없이 안드로이드 등 모바일 빌드하는 방법을 정리해 봅시다.안드로이드 등 유니티에서 모바일 빌드를 위해 확인할 사항일단 유니티에서 모바일 빌드를 하기 위해서는 External Tools에 안드로이드 SDK 등이 연결되어있어야 하는데요.Edit - Preferences - External Tools에 안드로이드가 있는지 확인이 필요합니다.이 글을 보고 있는 분들은 아무래도 안드로이드 빌드용 툴이 없겠죠.안드로이드 빌드를 위한 툴 설치안드로이드 빌드를 위한 도구 설치를 위해 프로젝트에서 벗어나 유니티 허브를 열어봅시다.여기..

프로그래밍/Unity 2025. 1. 16. 23:37

유니티 설치하고 개발 시작하기

유니티에서 게임 개발을 하기 위해서는 설치가 시작이죠. 설치 방법을 정리해 봤습니다.유니티 개발 도구 다운로드 사이트유니티 개발 도구는 기본적으로는 무료 라이센스이기 때문에 유니티 공식 홈페이지에서 다운로드 가능합니다. 실시간 3D, AR 및 VR 개발 툴 | 제품Unity는 최고의 게임 개발 플랫폼입니다. Unity로 고품질 3D/2D 게임을 개발하고 모바일, 데스크톱, VR/AR, 콘솔, 웹 등 다양한 플랫폼으로 출시해 열정적이며 충성도 높은 플레이어와 고객을 확보하세unity.com구글에서 유니티를 검색해서 들어간 뒤 우측 상단의 플랜 및 가격 버튼을 누르거나 상단 링크를 클릭해서 유니티 플랜 화면으로 들어가 줍니다.여기서 무료 버전인 유니티 Personal에 있는 지금 다운로드를 눌러줍니다.그러..

프로그래밍/Unity 2025. 1. 16. 00:20

Prev 1 2 3 4 ··· 38 Next

목록분류 전체보기 (301)

말랑말랑제리스타일

티스토리툴바