zabbix - mysql 접속 에러
·
TroubleShooting
Unable to determine current Zabbix database version: the table "dbversion" was not found zabbix를 띄운 후 mysql과 connect 하던 중 이런 에러가 나왔다. 분명 user가 맞는데도 이상한 에러가 나왔다. USER도 재생성해보고 접속을 해도 되지 않았다. -------- 아래 커맨드를 사용하니까 바로 되더라. zabbix 공홈에서 "Zabbix 서버 호스트에서 초기 스키마와 데이터를 가져와야 합니다. 새로 생성한 암호를 입력하도록 안내받게 됩니다." 라고 한다. 이과정을 띄어넘으면서 zabbix server를 설치하였는데, 이걸 다시 해줬다. 그러더니 아래처럼 다음 step으로 넘어갔다. 맞는 말인듯한데 왜
[Tuxedo] Oracle DB Tuxedo / XA 구성 - libclntsh.so.19.1 invaild 에러
·
TroubleShooting
[oracle@jwchoi|/home/oracle]$ ss sqlplus: error while loading shared libraries: /orahome/db/product/19c/lib/libclntsh.so.19.1: invalid EL F header [oracle@jwchoi|/home/oracle]$ vi /orahome/db/product/19c/lib/libclntsh.so.19.1 [oracle@jwchoi|/home/oracle]$ stat /orahome/db/product/19c/lib/libclntsh.so.19.1 File: '/orahome/db/product/19c/lib/libclntsh.so.19.1' Size: 21136 Blocks: 48 IO Block: 4096..
LIBGW_CAT:5318: WARN: Remote resource TOLOWER is removed, missing secondary/backup remote domain <LINUXDOM1> network configuration
·
TroubleShooting
LIBGW_CAT:5318: WARN: Remote resource TOLOWER is removed, missing secondary/backup remote domain network configuration 도메인 연결 구성 중 에러가 난다. Remote 소스 쪽의 TOLOWER 서비스가 네트워크 장애가 이루어지는 것 같다. 도메인 환경변수 파일인 DMCONFIG 설정이 잘못 되었을 확률이 높다. 아래의 에러를 보게 되었을 때, LDOM 파라미터가 뭔가 잘못? 되었다는 생각이 들었다. # dmloadcf -y domsimple CMDGW_CAT:3183: ERROR: Domain (LINUXDOM1) is not a (LOCAL) domain. (IC = 2) DM_TDOMAIN 섹션에서 LDOM ..
TPENOENT - no entry found / conversation모드에서는 서버의 수동 리부팅이 되지 않는다.
·
TroubleShooting
# 테스트  ## conversation 모드에서 서비스 호출이 안된다. 1. AP server에 CONV=Y 옵션을 주어 conversation모드로 설정하였다.2. Client에서 서비스를 호출하였지만 tperrno = 6 에러만 나왔다.3. CONV=N 옵션을 준 AP server에 호출을 하면 정상적으로 서비스 호출이 되었다.4. 생각해보자. 왜 conversation모드인 AP server에서는 tperrno = 6 에러 즉,  왜 해당 서비스를 찾을 수 없다는 에러가 나왔을까?짐작해보자면...5. conversation모드에서는 대화형 모드로 서버/클라이언트가 연결된다. 이에 사용되는 함수가 tpconnect() 이며 메세지를 주고 받을 때 tpsend() tprecv()함수를 사용한다.연결을..
Hang up 이란 ?
·
TroubleShooting/시스템 안정성 강화
# Hang up이란  통상적으로 서버 프로세스 자체는 기동 되고 있지만, 클라이언트의 request 시에 서버에서의 아무런 reply가 없는 것을 의미한다.   # Hang up의 종류  1. 서버 resource의 부족으로 인한 Hang up  서버의 자원들이 여러개의 Thread를 실행하느라 추가적인 작업 수행에 필요한 Thread가 없을 수 있다.결국 모든 resource와 thread가 바쁘게 프로세싱 되고 있는 상태이다.  2. Deadlock  교착현상. 서로가 Lock의 원인이 되어 이러지도 저러지도 못하는 교착의 상황을 말한다.발생하는 이유는 여러 조건이 있으며, 발생 시에는 Deadlock에서 Hang up 까지 이어진다.  Deadlock 걸리는 조건  1) 프로세스가 resource..
HA / High Availability 란?
·
TroubleShooting/시스템 안정성 강화
HA 란 ?- 고가용성, 고가용도  가용성은 시스템 에러 시 얼마나 빠른 시간 내에 복구 되어 다시 정상적으로 서비스할 수 있는 상태인지를 분석하는 척도이다. 따라서 HA 구성이란 이러한 가용성을 극대화 시키는 구성을 말하는 것이다.   1. 서버 이중화(HA- High Availability) 솔루션의 필요성. 많은 고객사의 IT관리자 분들은 현재의 IT서비스의 연속성을 지속적으로 유지하는 방안에 대한 고민을 한번쯤 하게 된다. 그에 따라, 서버 다운타임 최소화, 백업, 가용성 유지 등으로 정보 검색을 하다 보면, 마지막에 만나게 되는 단어가 “서버 이중화”, “서버 HA”등이 될 것이다. HA(High Availability)를 간단히 한국어로 직역을 하자면 “고가용성” 이라고 말하기도 하는데, Wi..
[Tuxedo] TM_SVCTIMEOUT_SIGTERM 파라미터와 tmshutdown -w 옵션이 많이 사용되지 않는 이유
·
TroubleShooting
# TM_SVCTIMEOUT_SIGTERM 옵션은 SERVICES 섹션에 설정된 SVCTIMEOUT 값(초)에 의존한다. 만약 TM_SVCTIMEOUT_SIGTERM=YES이고 SVCTIMEOUT=10초 로 환경설정이 되어있다면 AP server로 부터 SVCTIMEOUT이 10초동안 발생하게 되면 곧바로 SIGTERM이 사용되어 해당 서비스를 가지고있는 AP server는 terminate되며 restart 된다. (*SERVERS 섹션에서 RESTART=Y로 되어있는 경우에 한함) 140642.node1!BBL.9110032.1.0: CMDTUX_CAT:1837: WARN: Server(49414440) processing terminated with SIGTERM after SVCTIMEOUT 14..
[Tuxedo] TM_SHUTDOWNTIMEOUT 테스트
·
TroubleShooting
# TM_SHUTDOWNTIMEOUT  0~65535(초) 까지의 값을 설정 가능하며, 이 파타미터가 설정되어 있으면 tmshutdown은 timeout을 처리한다.AP server 프로세스가 TM_SHUTDOWNTIMEOUT 으로 설정된 시간(초) 이내에 정상적으로 종료되지 않으면, tmshutdown 은 더 이상 기다리지 않고 아래와 같이 메시지를 남기고 계속 진행하게 된다.  tmshutdown -s simpserv Shutting down server processes ... Server Id = 21 Group Id = APPGRP2 Machine = SITE2: timeout Server Id = 21 Group Id = APPGRP1 Machine = SI..
[Tuxedo] SHM 모드에서 BBL의 상태가 DEAD 일 때
·
TroubleShooting
잘 띄워진 BBL을 kill -9 로 죽였다. psr로 확인하니 DEAD 상태가 나왔다. psr 과 psc 커맨드는 들어먹지만 pclt 커맨드는 사용되지 않는다. BBL의 관리하에 WSH가 움직이기 때문이다. BBL이 죽으면 tmshutdown 도 되지 않는다. master node로 해당 명령어를 사용하라는 로그만 나온다. >tmshutdown -cy Shutting down all admin and server processes in /ofm/jwchoi/sw2/tp/tuxedo12.2.2.0.0/samples/atmi/simpapp/tuxconfig tmshutdown: internal error: CMDTUX_CAT:766: ERROR: must run on master node >tmshutdo..
[Tuxedo] WARN: Server(42271008) processing terminated with SIGTERM after SVCTIMEOUT
·
TroubleShooting
UBBCONFIG 환경파일의 SERVICE 섹션에서 SVCTIMEOUT=15(초) 로 설정을 해주었기 때문에 아래와 같이 ULOG에는 15초에 한번씩 SVCTIMEOUT 되는 log가 떨어진다. 내가 알고 싶은 건 SVCTIMEOUT이 일어나고 15초 사이에 Service가 Hang 되었는지 아닌지다. => * 1초단위로 txrpt 수행해서 확인한다. # 테스트 AP server가 TOUPPER 서비스를 수행하는 평균시간으로 16초 마다 서비스 수행을 했던 것으로 기록된다. >txrpt -n TOUPPER -d 12/7 -s 18:16:06 -e 18:30:50 < stderr3 START AFTER: Wed Dec 7 18:16:06 2022 END BEFORE: Wed Dec 7 18:30:50 20..
[Tuxedo] WSNAT_CAT:1287 에러 / WSH - Client 의 disconnection
·
TroubleShooting
# WSNAT_CAT:1287 WSNAT_CAT:1287: WARN: Forced shutdown of client; user name ''; client name ''; workstation address '//10.11.118.102:2395' ## 원인 1.WSH의 Session 설정 시간을 초과한 경우에 발생. 2.WSL과 Session을 맺을때 User-ID, Password가 다른 경우에 발생 ## 조치 1.WSH의 Session 설정 시간을 늘이든지, UBB file의 WSL에 정의된 T option을 없앤다. 2.TPINIT 하는 부분의 User-ID, Password를 확인하여 설정한다. WSL SRVGRP="identifier" SRVID="number" CLOPT="[ -A ] [ s..
[Unix/Linux] 에러 Program terminated with signal 11, Segmentation fault.
·
TroubleShooting
Program terminated with signal 11, Segmentation fault.#0 0x00695a0e in malloc_consolidate () from /lib/libc.so.6(gdb) bt#0 0x00695a0e in malloc_consolidate () from /lib/libc.so.6#1 0x00697e37 in _int_malloc () from /lib/libc.so.6#2 0x00699cca in calloc () from /lib/libc.so.6#3 0xf79101f0 in GPT_new_ctx () from /mytuxedodirectory/lib/libengine.so#4 0xf7904455 in _e_ctx_declptr () from /mytuxedodi..
[Tuxedo] CMDTUX_CAT:1685: ERROR: Application initialization failure
·
TroubleShooting
tmboot -s simpserv 가 안됨. 아래 에러는 복합적인 에러임. 이유가 아주 다양하다. 그래서 어렵다. exec simpserv -A : CMDTUX_CAT:1685: ERROR: Application initialization failure # server 기동 안됨 >buildserver -o simpserv -f simpserv.c -s TOLOWER BS-2340148.c: simpserv.c: ld: 0711-224 WARNING: Duplicate symbol: .tpsvrinit ld: 0711-224 WARNING: Duplicate symbol: tpsvrinit ld: 0711-345 Use the -bloadmap or -bnoquiet option to obtain mor..
[Tuxedo] CMDTUX_CAT:1685: ERROR: Application initialization failure
·
TroubleShooting
# JSL 부팅 에러 # ULOG상 찍힌 에러 150903.node2!JSH.22020628.1.-2: JOLT_CAT:1008: "ERROR: Could not establish listening address on network 0x00021b59d36e5284" 150903.node2!JSL.35389942.1.0: JOLT_CAT:1079: "ERROR: Error starting mininum number of handlers" JSL 띄울 시 - 네트워크에 리스닝 할 수 없음. - Handler의 minimum number가 starting하는데 에러 발생. LISTEN할 Port를 사용중이어서 나오는 에러임. 다른 port로 사용한다.
[Tuxedo] LIBTUX_CAT:563 / LIBTUX_CAT:555 에러
·
TroubleShooting
563 ERROR: Unable to exec command - errno=errno_val Description The TUXEDO System/T application was running on a multi-processor environment. While attempting to use the sysmulti function, an error was detected. Action Contact your UNIX System Administrator. 555 ERROR: Unable to exec command - errno=errno_val Description The Oracle TUXEDO system attempted to execute the cleanupsrv process. The U..
계속 까먹네;