1969

전공/백준

1969

yha97 2023. 5. 22. 23:25

날짜 : 2023. 05. 22

사용 언어 : python

문제

코드

import sys

n, m = map(int, sys.stdin.readline().split())
dna = list()
res = ""
dist = 0
for _ in range(n):
    t = sys.stdin.readline().rstrip()  # dna 입력
    dna.append(t)

for i in range(m):
    check = dict()
    for s in dna:
        if s[i] not in check:
            check[s[i]] = 0
        check[s[i]] += 1
    v = max(check.values())  # 각 인덱스의 가장 많이 나온 숫자 확보
    t = list(check.keys())
    t.sort()
    for j in t:
        if check[j] == v:
            res += j  # dna 생성
            break
dist = 0
# 체크
for i in dna:
    check = -1
    temp = 0
    for j in range(m):
        if i[j] != res[j]:  # 서로 문자가 다른 경우
            dist += 1  # 추가

print(res)
print(dist)

풀이

- 각 인덱스에서 가장 많이 나온 스펠링을 구한 후 문자열을 생성한다.

- 그 문자열을 토대로 해당 인덱스마다 다른 것의 개수를 구한 후 출력

알게된 점

- 문제를 잘못봐서 삼천포로 빠졌다.

- "Hamming Distance란 길이가 같은 두 DNA가 있을 때, 각 위치의 뉴클오티드 문자가 다른 것의 개수이다." 라는 것을 단순 예시를 보고 value가 다른 인덱스 간의 차이로 착각하는 바람에 계속 문제 속에서 헤맸다.

1969

문제

코드

풀이

알게된 점

참고 사이트