반응형 text72 java HashMap source code 살펴보기 source code의 주석 살펴보기 더보기 (파파고로 번역을 돌렸다!) 1번째 주석 -> HashTable 구현체 고, key값으로 null 지원한댄다.(순서는 보장 x) Hash table based implementation of the " Map " interface. This implementation provides all of the optional map operations, and permits " null " values and the " null " key. (The " HashMap " class is roughly equivalent to " Hashtable " , except that it is unsynchronized and permits nulls.) This class .. 2022. 10. 11. java ArrayList source code 살펴보기 궁금하기도 하고 평소에 자주 쓰는 자바의 자료구조 클래스인 ArrayList를 한번 살펴보고자 한다. (사실 할일이 없어서가 맞다. 월급 루팡~) 소스코드는 여기를 참고 했다. 자바의 구현 구조를 보면 이렇다고 한다. 평소에도 이런 식으로 초기화를 한 뒤, 사용하곤 했다. 이제 보니 List는 interface, ArrayList는 실제 구현체 class 인걸 확인할 수 있다. List string_list = new ArrayList(); 자주 사용하는 함수는 나 말고도 구글링 해보면 천지삐까리로 많이 나오니 검색된 기능들이 실제로 어떻게 구현되어 있는지 확인해보자. Constructor 위에 적은 예시처럼 구현 class를 생성하는 생성자 코드를 살펴보자 //오브젝트 타입의 배열 private sta.. 2022. 9. 20. 멀티컬럼 PK는 왜? 어느 날, 친구에게 이런 카톡을 받았다. 이런 상황에서는 학생_수업 테이블에는 PK(primary key)를 만들어야 하는가에 대한 질문이었다. 나는 항상 테이블을 만들 때 PK를 기본으로 만들고 시작했었는데 (생각 없이) 생각해보자니 저 상황일 때도 만들어야 하는가? 에 대한 고찰 없이 무지성으로 만들었었다. 그럼 질문이 생긴다. PK는 모든 테이블에 꼭 필요한가? 학생-수업 테이블에서 FK 두 개를 묶어서 PK로 만들어 사용해도 되는가? PK를 구글링 해보면 잘 정리된 블로그가 많으니 해당 블로그를 통해 자세히 살펴보면 좋을 것이다. 위키 백과의 PK에 대한 설명 부분을 가져왔다. 테이블에서 정보 값(각 행)을 식별하기 위해 만들어진 null값이 허용되지 않고 중복이 허용되지 않는 키라고 볼 수 있다.. 2022. 8. 6. Garbage collection 이 무엇인가요? 왜 쓰나요? 어떤 문제가 있을까요? 누군가 인터넷에 올려놓은 면접 질문 리스트라고 해서 쭉 살펴봤는데 https://okky.kr/article/1255457 OKKY | 면접에서 들었던 & 했던 질문들 최근에 후배의 신입 개발자 면접을 도우면서 모의 면접관(?)으로서 던졌던 질문들을 공유합니다. 댓글로도 질문들 공유해주시면 많은 분들께 도움이 될 것 같습니다! 일반적인 질문들 1. 자기소 okky.kr 웬걸? 2번째 질문부터 막혔다. 나는... 컴공을... 졸업하고... 결국 코드 몽키가 되어버린 건가...? 그래서 나중에 이 지식이 필요할 미래의 나를 위해 한번 정리해보는 시간을 가진다. :) TL;DR Garbage collection 이 무엇인가요? → 접근 불가능한 객체들의 메모리 할당 해제 알고리즘 왜 쓰나요? → 필요 없는 객.. 2022. 8. 1. CORS 에 대한 간략한 설명과 img 태그를 채우기 위한 삽질 오늘 회사에서 한 일에 대해 다시금 생각해본다. 저번에 올린 블로그 글 결과를 토대로 뉴스 군집화를 해냈다. (done이라는 뜻. complete가 아니라…) 점진적 뉴스 군집화 하기 (incremental news clustering) 요즘 관심 가지던게 하나 있는데 바로 점진적 문서 군집화 무슨 소리냐 뉴스의 경우, 계속 써지고 발간되고 사람들한테 제공된다. 지금까지 내가 해온건 어떤 시간대 (가령, 하루단위) 뉴스를 군 hoonzi-text.tistory.com 결과를 그럴듯하게 보여주기 위해 해당 뉴스가 가진 썸네일 데이터를 가져와야 했는데 다행히도 우리회사 데이터는 해당 뉴스에 등장 하는 이미지 데이터 역시 수집이 되어 있었다. 그냥 조회만 하면 됐다. (아래는 결과 예시) 문제는 방송사의 경우.. 2022. 6. 27. 점진적 뉴스 군집화 하기 (incremental news clustering) 요즘 관심 가지던게 하나 있는데 바로 점진적 문서 군집화 무슨 소리냐 뉴스의 경우, 계속 써지고 발간되고 사람들한테 제공된다. 지금까지 내가 해온건 어떤 시간대 (가령, 하루단위) 뉴스를 군집화(clustering) 한뒤, 비슷한 주제, 이슈로 묶여있길 바라며 군집을 살펴보는 일이였다. (오늘의 주요 이슈는 무엇인지 군집화된 뉴스를 통해 살펴보기 위해) 문제가 있다. 뉴스는 계속 만들어지고, 이슈는 계속 변한다. 특정 데이터를 통해 만든 문서 벡터 공간은 새로운 데이터가 나타나면 유효하지 않다 (새로운 feature가 생긴다는 얘기다. 벡터 공간을 통한 비교를 수행할 수 없다.) 위의 두문제를 해결하면서도 주요 이슈를 확인하기 위한 군집화를 위해 하루치 몰아서 하는게 아니라 특정시간대별로 군집화를 수행한.. 2022. 6. 6. ㅇㅎ 게시물 수집하기 (fastapi, APScheduler, MySql) 개요 나는 커뮤니티를 자주 본다. 커뮤니티를 보다보면 게시물들 사이로 간간히 “ㅇㅎ” 라는 키워드가 붙은 게시물을 마주하게 되는데 “약한 후방주의” 라는 말의 줄임말이다. 후방 주의란? 남자들이 주로 접속하는 사이트들에는 하루에 적어도 하나씩 꼭 올라온다. 간간히 보이는 게시물은 보일때마다 무지성으로 클릭하게 되는데, 어느날 이런생각이 들었다. 하나로 모아서 보면 안될까? 좋은 생각이 떠오르면 그건 이미 누가 했다고 하던가... 이미 그런 사이트가 있었다. 모두의 후방 모두의 후방 모두의 후방 data.pureugong.com 하지만 나도 하나쯤은 만들어 보고 싶었다. 그래서 해당 사이트의 About 탭을 들어가 tech stack을 살펴본다. 오호 저런 기술로 구현하셨군... 하고 위로 좀만 올라가니 .. 2022. 5. 5. 다문서 요약 하기 (multi-document summarization) 요즘 요약에 관심이 있어서 관련 논문을 찾아 보던중 (취미로) ‘아 이건 나도 구현이 가능할 것 같은데?’ 싶은 논문이 있어서 정리해보려고 한다. 문서 하나에 대해 요약하는 건 블로그에 정리한게 있다. (물론 생성요약이 아니라 추출요약이다.) 요약은 크게 추출 요약 (extractive) 과 생성 요약 (abstractive) 으로 나뉜다. 오늘 해볼 건 추출요약 (extractive) 이다. 참고한 논문은 Clustering Sentences with Density Peaks for Multi-document Summarization 으로 비슷하게 주제의 기사들의 ‘문장’ 들 간의 밀집도를 바탕으로 중요한 문장을 ‘추출’ 한다. 이 논문에서는 중요도를 크게 3가지로 나누었는데, representativ.. 2022. 3. 1. 네이버 댓글, 다음 댓글 이진분류 해보기 예전에 친구와 얘기를 나누던 중, 다음 기사와 네이버 기사의 댓글 온도차(?) 가 크다는 걸 발견했었다. 문제가 됐던 기사 인데, 네이버와 다음의 댓글은 각각 이랬다. https://news.naver.com/main/read.naver?m_view=1&mode=LSD&mid=sec&sid1=100&oid=032&aid=0003083419 문 대통령, 북한 풍산개 '곰이'가 낳은 강아지들 모습 공개 [경향신문] 문재인 대통령이 3일 사회관계망서비스(SNS)에 풍산개 ‘곰이’가 낳은 새끼 7마리의 모습을 공개했다. ‘곰이’는 2018년 남북정상회담 당시 김정은 북한 국무위원장이 문 대통령에게 news.naver.com https://news.v.daum.net/v/20210703121619046 문 대통령.. 2022. 1. 23. 이전 1 ··· 3 4 5 6 7 8 다음 반응형