Changmo_log

  • 홈
  • 태그
  • 방명록

CV(Computer-Vision)/OpenCV 1

[OpenCV] YOLO 탐지 성능 향상을 위한 입력 이미지 전처리

사용자의 손과 식품들을 탐지하여 사용자의 행동 (음식을 들고 냉장고에 넣기, 음식을 냉장고에서 빼기, 음식 넣고 다른 음식 빼기)을 인식하여 자동으로 냉장고 관리 앱에 등록되는 기능을 개발하면서 발생한 어려움, 한계점들을 해결하는 과정에 대해 설명하는 시간을 가져보려 한다. 기존 모델은 Yolov11n, LSTM, Mediapipe를 통해 연계하여 객체 탐지, 동작 인식을 모두 수행했다. 학습 데이터 셋은 Yolo 모델은 식품 당 1,000장 총 23종 식품으로 약 23,000장의 식품 이미지로 학습했다.LSTM은 좌표값을 직접 Excel파일로 입력하여 손, 객체 좌표의 이동을 프레임마다 기록하는 형식으로 직접 생성하여 학습했다. 기존 YOLO 모델의 한계점은 조명 변화에 취약하고 이에 따라 다른 클래스..

CV(Computer-Vision)/OpenCV 2025.09.22
이전
1
다음
더보기
프로필사진

Changmo_log

글 하나가 쌓여 기술백서가 되는 날까지 꾸준히 기록합니다!

  • 카테고리 분류 N
    • [프로그래밍 언어]
      • C#
      • Java
      • Python
      • Kotlin
      • C++
    • 운영체제(OS)
      • Linux
    • Network
    • 자료구조(Data Structure)
    • DB(DataBase)
    • AI
      • Deep Learning
      • Machine Learning
    • Back-end
      • FastAPI
    • Spring
    • Front-end
    • Embedded
      • Raspberry Pi
    • CV(Computer-Vision)
      • OpenCV
    • Android
    • Project
    • Algorithm
      • 프로그래머스
      • 백준
    • Cloud & Container
    • Etc N
      • Git
      • 알코테 스터디
      • 코드트리 청약 챌린지 N

Tag

코드트리 #코딩테스트 #코테공부 #코테준비 #알고리즘공부 #갭체크,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바