CV(Computer-Vision) 3

[GStreamer] Gstreamer 기초. 튜토리얼 정리 Ch1 - 16

이번 포스팅에서는 이러한 GStreamer 프레임워크의 공식 Basic tutorials를 모두 진행해보는 시간을 가진다.GStreamer가 무엇인지 모르거나, 기본적인 요소들에 대한 것들은 아래 글에 정리해두었다.[GStreamer] GStreamer 기본 개념 및 명령어 튜토리얼들은 모두 Linux 환경에서 진행했다.튜토리얼은 1~16강 까지. 16강으로 생각할 수 있지만 중간에 15강이 빠져, 총 15개의 튜토리얼이 있다. GStreamer 공식 튜토리얼https://gstreamer.freedesktop.org/documentation/tutorials/basic/index.html?gi-language=c#basic-tutorials1. Basic tutorial 1 : Hello World!..

CV(Computer-Vision) 2026.04.30

[GStreamer] GStreamer 기본 개념 및 명령어

GStreamer: 멀티미디어 데이터를 처리하기 위한 오픈소스 프레임워크.단순히 동영상을 재생하는 플레이어가 아닌 영상을 자르고, 붙이고, 변환하고 분석하는 모든 과정을 '파이프라인'의 구조로 설계할 수 있도록 해주는 프레임워크이다. GStreamer는 다양한 분야에서 많이 사용되고 있다.영상 재생기스트리밍 서버/클라이언트 (RTSP, HLS)영상 트랜스코딩 (포맷 변환)카메라 영상 처리 (라즈베리파이, Jetson 등 엣지 디바이스)AI 비전 파이프라인 (NVIDIA DeepStream이 GStreamer 기반) 파이프라인 구조의 GStreamerGStreamer의 핵심 구조는 '파이프라인'이다. 데이터가 왼쪽에서 오른쪽으로 흘러가는 구조다. [source] → [filter/convert] → [si..

CV(Computer-Vision) 2026.04.23

[OpenCV] YOLO 탐지 성능 향상을 위한 입력 이미지 전처리

사용자의 손과 식품들을 탐지하여 사용자의 행동 (음식을 들고 냉장고에 넣기, 음식을 냉장고에서 빼기, 음식 넣고 다른 음식 빼기)을 인식하여 자동으로 냉장고 관리 앱에 등록되는 기능을 개발하면서 발생한 어려움, 한계점들을 해결하는 과정에 대해 설명하는 시간을 가져보려 한다. 기존 모델은 Yolov11n, LSTM, Mediapipe를 통해 연계하여 객체 탐지, 동작 인식을 모두 수행했다. 학습 데이터 셋은 Yolo 모델은 식품 당 1,000장 총 23종 식품으로 약 23,000장의 식품 이미지로 학습했다.LSTM은 좌표값을 직접 Excel파일로 입력하여 손, 객체 좌표의 이동을 프레임마다 기록하는 형식으로 직접 생성하여 학습했다. 기존 YOLO 모델의 한계점은 조명 변화에 취약하고 이에 따라 다른 클래스..