이수의 삽질 기록
article thumbnail
[Nvidia] nvidia-docker로 localGPT 돌리기
Knowledge/Linux 2024. 1. 9. 03:10

배경 내가 클라우드를 좋아 하고, 인공지능을 하지 않고 별로 좋아하지 않는 이유는 1) 수학이 싫어서 2) GPU 설정하기 싫어서. 두 가지로 나뉜다. 하지만, N 교수님이 당장 인공지능을 LLM을 돌려보라는 말을 하셔서 해야한다. 정확히는 스토리가 길지만, 언제나 그렇듯 원래 다른 사람의 일이였으나 어쩔 수 없이 울며 겨지먹기로 인공지능을 해야한다. 제약사항: PCI Passthrough 언제나 그렇듯, 우리의 환경은 클라우드 환경이다. 누군가는 아니 그냥 설치하고 cuda 툴킷 설치하면 되는거 아니냐? 그거 못 설치하면서 리눅스 한다고 하냐? 이래서 인프라 하는 놈들은 안된다. 이라는 말을 할지 모른다. 하지만, 우리에게는 언제나 그렇듯, 제약사항이 존재한다 우리의 머신은 RTX 4090 두대가 들어..

article thumbnail
[eBPF] bpf_trace_printk 출력 방법
Programming/eBPF 2023. 7. 27. 11:55

배경 LSM-BPF를 하면서, LSM hook이 걸렸지만, 실제로 실행이 되지 않는 상황이 발생했다. 그래서 이를 해결하기 위해서, 그리고 이게 정말로 동작하는지를 확인하기 위해서 bpf_trace_printk를 사용하게 되었다. 이런 과정에서 알게된 삽질 내용이다. 따라서, 간만에 본업 중 하나인 eBPF에 관한 글을 적게 되었다. 시작하기 전에... 알 사람들은 알겠지만, 나는 cilium의 eBPF를 사용한다. 만약 bcc 또는 그냥 bpftool로 로딩하는 eBPF를 사용하는 경우에는 이게 잘 동작하지 않을 수 있다. 사실 물론 다 같이 동작하긴 하지만, 살짝의 차이점이 있을 수 있다는 것을 인지했으면 좋겠다. 우선 배경지식으로 알고가면 좋을 내용에 대해서 먼저 알아보도록 하려고 한다. 우선 흔히..

article thumbnail
Kubernetes x509 인증서 연장
Knowledge/Kubernetes 2023. 7. 14. 11:30

배경 관리하던 학교 Kubernetes(이하 K8s) 클러스터에 접속해서 관리를 하려고 했더니 다음처럼 나왔다. $ kubectl get pods Unable to connect to the server: x509: certificate has expired or is not yet valid: current time 2023-07-14T01:22:53Z is after 2023-07-10T11:45:22Z 그래서 이를 해결하고자 살짝의 삽질을 했다 (한 10분 정도니까 삽질이라고 하기도 좀 그렇다...) 인증서 확인 먼저 정말로 X509 인증서가 만료되었는지 확인하자. sudo kubeadm certs check-expiration [check-expiration] Reading configuratio..