1 min read
research.atspotify.com/ large parquet dataset을 위한 PyTorch dataset 및 dataloader 튜닝 일기
추천 시스템 관련된 여러 기업들의 tech blog 들을 모아놓자 기술 블로그를 모아 놓은 github: https://github.com/seonggwonyoon/techblog SNS 인스타그램: https://instagram-engineering.com/tagged/machine-learning 페이스북...
굉작히 작은 prediction accuracy 상승이라도 이는 전체 매출에 큰 상승으로 이어진다. 수치로 따지면, 대략 1% 정도의 logloss (또는 AUC) 상승을 의미한다.
overfitting 에 대응하기 위해서는 많은 training data 를 이용해서 학습하는 것이 좋다. 특히, 이미지 데이터의 경우, 기존 이미지를 변형해서 새로운 이미지 학습 데이터를 만들 수 있다....
ONNX is an open format built to represent machine learning models.