iOS의 주어진 이미지에서 다중 사용자 정의 개체 감지(이미지 처리) (Multiple Custom Object Detection (Image processing) from a given Image in iOS)


문제 설명

iOS의 주어진 이미지에서 다중 사용자 정의 개체 감지(이미지 처리) (Multiple Custom Object Detection (Image processing) from a given Image in iOS)

사용자 정의 개체가 프레임으로 감지되도록 하고 싶습니다.

  • 나는 이것과 관련하여 확인했고 ARKit 구현으로 많은 것을 얻었습니다. 이를 사용하여 라이브 개체 감지(즉, 입력 스트림을 카메라 스트림으로 사용)를 얻을 수 있지만 제 요구 사항은 주어진/정적 이미지에서 가져오는 것입니다.

  • 분류 또는 직사각형 또는 얼굴 감지 등을 제공하는 입력 스트림으로 카메라를 사용하여 최신 iOS 지침/샘플을 찾았습니다. .

    • 내 문제는 사용자 정의 다중 개체가 있는 주어진 이미지에서 가져와야 한다는 것입니다.

      예를 들어, 주어진 이미지에서 시계를 식별해야 합니다(다른 유형의 여러 시계가 있는 벽 이미지). 여기에서 샘플 시계 이미지를 제공할 수 있습니다. 따라서 프레임과 함께 식별된 시계를 가져와야 합니다.

      객체 분류와 함께 Vision의 VNImageBasedRequest를 사용하여 확인했는데, 여기서 맞춤 훈련된 CoreML 모델로 분류를 얻을 수 있지만 boundingBox 속성을 사용하여 VNDetectedObjectObservation에서 사용할 수 있는 프레임을 가져옵니다.

귀중한 시간에 미리 감사드립니다 & 응답.

VNDetectedObjectObservation에서 사용할 수 있는 프레임을 가져오는 속성입니다.

귀중한 시간을 할애해 주셔서 감사합니다. 응답.

VNDetectedObjectObservation에서 사용할 수 있는 프레임을 가져오는 속성입니다.

귀중한 시간을 할애해 주셔서 감사합니다. 응답.


참조 솔루션

방법 1:

You can do it making use of Google Cloud AutoML Vision Object Detection. If you want to detect custom objects you need to create your own custom model dataset and train it. Once the model is trained either you can host it on cloud and make an API call from the iOS app to detect the objects from your static image(online) or you can add the trained model to your project to detect the objects from image(offline). You can find the complete documentation here https://cloud.google.com/vision/automl/object‑detection/docs/before‑you‑begin

If you are able to get it done in any other way please let me know how, even I'm working on similar use case.

(by UnnikrishnanMister Perfect)

참조 문서

  1. Multiple Custom Object Detection (Image processing) from a given Image in iOS (CC BY‑SA 2.5/3.0/4.0)

#image-processing #swift #visionkit #object-detection #iOS






관련 질문

이미지를 원통 또는 구 모양으로 매핑하시겠습니까? (Mapping image into cylinder or sphere shape?)

Android 마스킹 활동 만들기 (Android Creating a masking activity)

ImageJ 오버레이 ROI 줌 (ImageJ Overlay ROI zoom)

Virtex-5 FPGA 보드와 VGA 인터페이스 (interfacing VGA with Virtex-5 FPGA board)

C++ 이미지 처리, 입자 계산 (C++ image processing, counting particles)

훈련된 신경망을 사용하여 이미지에서 여러 객체를 식별하는 방법은 무엇입니까? (How do you use a trained neural net to identify multiple objects in an image?)

기계 학습을 사용하여 손으로 쓴 서명 이미지의 배경 제거 (Using machine learning to remove background in image of hand-written signature)

인수 '%s'에 대해 예상 Ptr<cv::UMat> 임계값을 지정하는 동안 오류가 발생했습니다. (getting an error while doing thresholding Expected Ptr<cv::UMat> for argument '%s')

iOS의 주어진 이미지에서 다중 사용자 정의 개체 감지(이미지 처리) (Multiple Custom Object Detection (Image processing) from a given Image in iOS)

두 개의 유사한 이미지에서 노이즈를 추출하는 방법은 무엇입니까? (How to extract noise from two similar images?)

OpenCV를 사용하여 이미지의 흰색 패치를 자르고 여권 크기의 사진을 만드는 방법 (How to crop white patches in image and make passport size photo using OpenCV)

OpenCV 그리기 특정 윤곽선 (OpenCV drawing specific contours)







코멘트