티스토리 뷰

반응형

데이터라벨링 하는 방법

 

 

최근 재택부업, 재택근무, 프리랜서로 직종으로 데이터 레이블링이 유행이다.

 

초기 자본이나 투자금이 들어가지 않는 순수 마우스질 노가다로 남는 시간, 아니면 자기전, 화장실에서 스마트폰으로 게임대신 하는 아직은 블루오션이다.

 

당연히 건바이건으로 건당 최소 몇백원~몇만원까지 다양하게 있다.

 

잡소리는 각설하고

 

데이터라벨링 말만 들어보면 뭔가 어렵다.

 

 

하지만 간단하다. 주어진 과제에 데이터를 마킹하거나 찾으면 되는 단순 작업이다.

 

물론 건당 몇만원짜리는 사진 속의 객체가 많거나 텍스트가 엄청난 양이 ㄷㄷㄷ, 하지만 낮은 단가의 과제는 사진도 단순해서 객체가 몇 개가 안되니 금방한다.

 

자 이제 어떻게 하는지 알아보자.

 

Q. 애국가는 어느나라의 국가인가?
애국가(愛國歌)는 대한민국의 국가이다. 1919년 안창호에 의해 대한민국 임시정부에서 스코틀랜드 민요인 〈작별〉에 삽입해서 부르기 시작하다가 1935년 한국의 작곡가 안 씨가 지은 《한국환상곡》에 가사를 삽입해서 현재까지 부르고 있다.

가사의 작사자는 윤치호 설, 안창호 설, 윤치호와 최병헌 합작설 등이 있다. 윤치호의 작사설 때문에 대한민국 임시정부에서는 애국가를 바꾸려 하였으나 대한민국 임시정부 주석 김구의 변호로 계속 애국가로 채택하게 되었다. 이후 1948년의 정부 수립 이후 국가로 사용되어 왔으며, 2010년 국민의례 규정에서 국민의례시 애국가를 부르거나 연주하도록 함으로써 국가로서의 역할을 간접적으로 규정하고 있다.

 

텍스트 작업 예를 들면

질문에 대한 정답은 아래에 있는 본문에서 찾아서 마킹을 하는 것이다. 

애국가는 어느나라 국가냐라는 질문에 본문에 대한민국의 국가이다라는 답이 있다. 어느나라 국가? 대한민국이니 '대한민국' 단어에 마우스로 드래그해서 마킹을 하면 끝이다.

여기서 궁금해지는게? 저 마킹은 무엇으로 하나?이다
이는 데이터 레이블링 사이트에 접속하면 웹에서 해당 작업을 할 수 있게 웹프로그램이 실행이 된다. 

 

다음은 사진이나 이미지에서 요구하는 객체를 마킹하는 작업이다. 

 

데이터레이블링

 

텍스트 작업 예를 들면

사진에 새 한마리가 있다. 객체를 마킹한다.

 

데이터레이블링 예제

 

사이트에서 제공하는 웹프로그램으로 윗짤처럼 새의 테두리를 마킹한 후 '동물'이라고 체크를 해주면 된다.

마킹을 할때 주의해야할게

1. 사각형으로 해야한다.

2. 가능하면 객체가 잘려선 안된다.

 

기본적인 설명은 이게 끝이다. 간단하다. 이것만 알면 된다.

 

객체가 여러개 겹쳐있거나 많은 복잡한 이미지와 아주 길거나 전문용어 텍스트 등으로 데이터레이블링의 어려움과 쉬움이 나눠지게 된다.

 

여기까지보고 '나도 할 수 있겠다'라고 생각이들면 'https://works.crowdworks.kr' 여기에서 튜토리얼을 통해서 좀 더 자세히 연습해보고 직접 돈도 벌어보자.

 

AI를 학습시키는 데이터라벨링, 지금 바로 시작하세요! | 크라우드웍스 데이터 라벨링

데이터 라벨링 그 이상의 경험을 제공합니다. 크라우드웍스에서는 누구나 쉽게 AI를 학습시키고 수익을 얻을 수 있는 경험을 모두에게 전달하고자 합니다.

works.crowdworks.kr

 

추천인 뭐 이런거 아니니 걱정말고 링크타고 이동 ㄱㄱ

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
글 보관함