기계학습에서 성능을 평가하기 위한 방법으로

BLEU라는 방법을 사용한다.


간단히 요약하면

하나의 영어 문장이 있다고 할때

이 문장을 여러사람이 번역한다.

이것을 각각 ref1, ref2라고 하고

기계번역으로 번역한것을 mt라고 했을때

mt의 결과를 unigram, bigram, trigram으로 각각 ref1, ref2에 몇번 나타나는지를 계산하는 방식이다.


           

          http://amta2010.amtaweb.org/AMTA/papers/6-04-LavieMTEvaluation.pdf