MSA에서는 템플릿 사용 공통적인 부분 처리 → 개발을 빠르게 하기 위한 needs 충족
질문처럼 하는데 노션을 사용하는 경우도 있고 회사에서는 공통모듈을 위한 깃 레포를 만들기도 함. 젤 사용하기 쉬운 부분을 먼저 사용하는 것을 추천함.
답변이 어려움 spring cloud에서 디테일한 부분에 대해서는 조금 어렵다고 함….
같은 의견이 3번 이상 나와야 참 일 수가 있다…
이 부분 동규팀장님 채워주세요..
재학습 이슈 .. 재학습 로직을 만듬 .. 하루에 한번씩 가자.. 또는 일주일에 한번씩 가자.. 성능 지표가 떨어지면 재학습을 시키자… MAE를 지표로 사용하는 경우도 있지만 기준에 대한 부분이 모호함.. 따라서 현업에서는 하루에 한번.. 일주일에 한번정도로 스케쥴링 전략을 잡아가는 것이 좋다. 새벽에 재학습을 하는 편이긴 함.. 유튜브의 경우에는 실시간 뒤에 벡터가 있어 비슷한 사람을 찾아줌
DB를 같이 쓴다 (하이브리드 방식) DB의 경우에는 모아보자... 지금 경우에는 이슈가 많이 생길 수가 있음.. 성능 튜닝을 많이 해보아도 어렵기 때문에 DB는 같이 쓴다... 하이브리드 방식에 대해서 많은 자료가 있으니까 참고해보면 좋을 것 같다..
Kafka에 두고 나중에 DB에 옮긴다.. 처음에는 카프카의 스트리밍을 사용해서 사용자가 얼마나 검색을 했다를 수집해서 외부 추천하려 했지만 지금은 mongodb에 저장하는 과정만 생각함... 목적이 명확하지 않고 어떻게 사용되지 않는다면 대부분 거절... 따라서 목적이 명확해야함... kafka가 유지비용이 높은 편이고 유지보수가 어려운 편임... 실시간 처리가 필요할까?? 재학습에 대한 이슈와 같이 고민해 볼 수 있어야함.. 기능에 대해서 구체적인 부분이 나와야 함. 보통 로그 데이터를 s3에 떨어뜨린다음에 파싱을 하는데 데이터분석에 최적화된 DB에 (데이터 웨어하우스) 활용해볼 필요가 있음. 이렇게 실제 인터뷰에 들어간다면 카프카에 대한 질문을 30분 받을 수 있음... 실시간 처리가 필요하지 않다면 air flow를 사용하여 배치 파이프 구축.. 보통 실시간은 kafka를 사용하긴한다. 사용자 로그의 경우에는 DB로 안가고 데이터 웨어하우스로 간다....