Kuitu, teamspeak-palvelin ja ailahteleva yhteys (packet loss 100%)


  • Kommentaattori
  • 40 kommenttia

Moi!

Mulla on kotona palomuurina erillistietokone (i3-2100) joka pyörittää pfSenseä, jonka perässä on palvelin (24thread 96GB jne jne..), jossa on Proxmox-käyttöjärjestelmän alla LXC-containerissa pyörimässä Teamspeak 3 -palvelin. Yhteytenä on Elisa 1000/100Mbit kuitu. Käyttäjäni asuvat samalla paikkakunnalla, myöskin Elisan kuidun perässä (vähintään 100/10 yhteydellä) (pingi 1ms).

Resursseja on vaikka muille jakaa, ja yhteys käyttäjien välillä on lähellä ihanteellista kun ollaan saman operaattorin alla samassa kaupungissa valokuidulla.

Ongelmana kuitenkin on se, että välillä kenen tahansa käyttäjän ääni pätkäisee kesken lauseen, emme kuule häntä, eikä hän meitä. “Blackout” kestää n. 5-10 sekuntia. Tämä ei ole siis vain yksittäisen käyttäjän ongelma, vaan tulee yksi kerrallaan satunnaisesti jokaiselle käyttäjälle. Tätä on jatkunut ainakin vuoden, sanoisin siitä asti kun talojakamoon saatiin vaihdettua gigainen kytkin 100M Ciscon tilalle (josta minulla on täällä omayhteisössä ollut jo oma tappelulanka, VOAS&Elisa&Voimatel). En ole vain jaksanut selvittää ongelmaa, kun oletin vian olevan laitteistossani ja turhautuneena jatkoin maksullisen Hetzner-palvelimen käyttöä. (kyseinen ongelma on täysin poissa kun samat käyttäjät ovat Hetznerin palvelimella!)

Sen sijaan että koittaisin selvittää ongelmaa minun laitteistoistani ja ohjelmistoistani, joita ymmärettävästi olisi helppo syyttää, näin helpommaksi ohittaa ne kaikki.

Laitoin Teamspeak-palvelimen pyörimään ylimääräiseen tietokoneeseen (ei siis aikaisempi mainittu sama palvelintietokone), johon asensin puhtaan Ubuntu Server 20.04 käyttöjärjestelmän, jonka liitin kiinni suoraan datanousuun - ei palomuuria välissä. Se saa suoraan julkisen IP-osoitteen. Iptables/ebtables/UFW ei ole käytössä.

Lopputulos on kuitenkin se, että edelleenkin lauseet katkeavat satunnaisesti, packet loss nousee hetkellisesti 100%.. eli olen mielestäni eliminoinut mahdollisen ongelman päässäni, ja syytänkin siis Elisaa. Liitteinä toistaiseksi ainut data tästä ongelmasta, Teamspeak joka kertoo pingin ja packet lossin (suoraan nousussa kiinni, ei palomuuria). Mikään muu ei kuormita internet-yhteyttäni.

Onnistuuko tätä kautta ongelman selvittäminen? Profiilissani on osoite ja puhelinnumero.


21 kommenttia

Toinen liite ei näköjään aloituspostaukseen selvinnyt.

Ongelmana on myös että packet loss on *jatkuvasti* 0.5-1.5% - kun taas Hetznerillä se oli tasan 0.00%! Jossakin on selvästi jotain pielessä. Kun packet loss on selvästi suurempi (>10%), se meinaa että se on hetkellisesti käynyt 100%:ssa ja keskiarvo laskee pikkuhiljaa alaspäin. Mutta nämä 0.5-1.% packet lossit eivät ole jäännöksiä 100% packet lossista, sillä arvo sahaa edestakaisin 0.5 - 1.5 - 0.5 - 2% jne jne, eli siellä on jatkuvaa pientä packet lossia.

 

Tässä vielä molempisuuntainen mytraceroute Hetznerin ja minun välillä:

 

Käyttäjätaso 5

Morjes @bindi:slight_smile:

Nyt pistitkin kyllä kinkkisen dilemman :sweat_smile: en osaa nyt suorilta sanoa mistä kiikastaa, joten lähdetään yhdessä selvittämään. Jos muilla OmaYhteisöläisillä on samantyyppisistä set-upeista kokemusta niin soppaan vain mukaan kommentoimaan :thumbsup_tone2:

Mainitsit että ongelmia on ollut noin vuoden verran, huomasitko siis että tämä alkoi suoraan siitä kun kytkimet vaihdettiin? :thinking: Oliko tuolla 100M Ciscon kytkimellä lainkaan samantyyppisiä ongelmia, vai ainoastaan näillä gigaisilla?

Tuolla 100M ciscolla oli aivan sairaasti muita ongelmia (jatkuva loss%, ei saanut täyttä 100M) - siksi se vaihdettiinkin, siksi jouduin ostamaan tuon Hetznerin palvelimen alunperinkin kun käyttäjät CS:ää pelatessa valittivat teamspeakin robottiäänestä (korkea loss%)  Ja kyllä, siitä lähtien kun Huawei giganen tuli kellariin, tämä ongelma oli olemassa. Kaverit hieman nauroivat että nytkö se netti on muka korjattu, ja eikun takaisin Hetznerille…

Ajoin muuten molempisuuntaista mytraceroutea käyttäjäni (suoraan datanousussa kiinni) ja minun välillä, 30min ajalta se kertoi loss% tasan 0.0%. Emme käyttäneet teamspeak-palvelintani samanaikaisesti, mutta kuitenkin. Pitää yrittää löytää hetki jossa voimme kokeilla palvelinta ja mtr:ää samanaikaisesti. 

Käyttäjätaso 4
Kunniamerkki

Veikkaan viaksi, joko 1. taloyhtiön sisäisiin kaapeleisiin tulevaa häiriötä tai 2. Elisan päässä olevaa vikaa.

  1. kohta selviää jos saat jakamoon hetkeksi sen palvelimen vietyä ja testattua jatkuuko ongelma.
  2. ykkös kohdan testillä on todettu vian oleven Elisan päässä

 

Edes Elisan ADSL aikoina ei ollut noin suurta packet lossia, joten eniten veikkaan Elisan päätä. Toki jos huoneistoon tuleva nousukaapeli on pitkä ja kulkee liian lähellä sähkökaapeleita se voi aiheuttaa häiriöitä. Elisan pään ongelmia en nyt lähde arvailemaan.

 

Jos Ciscollakin oli ongelmia niin kuulostaa, että nousukaapeli liian pitkä tai joku aiheuttaa häiriötä. Itse uskon Ciscon laatuun ja Huawein halvempaan hintaan. Kannattaa tarkistaa kaapeleiden tyypit ja että ovat suojattuja, jos se hiukan vaikuttaisi.

Tuskin kaapeleiden pituus tai suojaamattomuus vaikuttaisi siihen, että ongelma on vain sisäänpäin, minuun yhdistettynä? Ja kuten sanoin, mytraceroute käyttäjän ja minun välillä kumpaankin suuntaan 30min ajalta antoi 0.0% loss. Eikä minulla myöskään ole ongelmia teamspeakissa kun olen Hetznerin palvelimella.

Teamspeak 3 käyttää UDP-protokollaa äänen siirtämiseen. Olen tässä hieman leikkinyt iperf3:lla, ja huomasin jotain mielenkiintoista (mutta ehkä normaalia, joku voi varmasti kertoa onko tämä turhaa dataa vai ei): välillä paketit katoavat kokonaan, niin että vastaanottava pää iperf3:sta ei tiedä niistä mitään ja näyttää pakettien määrän väärin. Tämä tapahtuu vain korkeilla nopeuksilla (50Mbps), teamspeak-äänihän käyttää tuosta todella paljon vähemmän. En toistaiseksi saanut samaa ilmiötä esille 1Mbps nopeuksilla.

 

Välillä kuitenkin sama komento toimii oletetusti (tosin korkeahkolla loss% 33% - onko se normaalia vai kuuluu UDP:n luonteeseen?)

Ilman reverse tilaa saan kuitenkin UDP:lla 500Mbps 1.9% loss, 1000Mbps 19% loss - joten tuo 50Mbps ja 33% loss reverse tilassa tuntuu kovin korkealta..

 

Tähän kiinnostaisi jonkinlainen vastaus, selvitys, vinkki tai vastaava. Vikailmoitusta en ole tehnyt, koska uskon sen johtavan asentajakäyntiin joka käy ajamassa parit speedtestit kellarissa ja toteaa yhteyden mainioksi ja minulle lätkäistään turhasta ilmoituksesta maksu.

Mutta kuten olen osoittanut, vika on muualla kuin laitteistossani, ja liittyy ehkäpä jotenkin teamspeakin käyttämään porttiin ja/tai protokollaan (UDP), vain minuun yhdistäessäni (teamspeak client toimii itselläni normaalisti muita palvelimia käyttäessä), ja kahden Vaasalaisen (minun ja käyttäjäni) välillä mytraceroute kumpaankin suuntaan antoi tasan 0.0% loss 30min ajalta, kun taas teamspeakissa näitä katkoksia tuli 5-10min välein.

Mitäs nyt?

Käyttäjätaso 6
Kunniamerkki +1

Joo kieltämättä on vähän sellainen tilanne, että tämä tuskin vikailmoituksella ratkeaa. Lähinnä tuota mietin, kun palvelu tuolta Hetznerin kautta toimii myös sinun nettiliittymäsi kautta, ei liittymän häiriö oikein voi ongelmaa selittää. Muutamia porttisuodatuksia toki liittymiltä löytyy, mutta nuokin sitten estäisivät käytön kokoajan eivätkä vain satunnaisesti. 

Mutta hei, ihan täytyy kysyä että onko jokin syy, että juuri Teamspeakkia haluatte käyttää? Tuttu palvelu itsellekin vuosien takaa, mutta nykyisin löytyy kovin paljon helpompia vaihtoehtoja, joissa ei tarvitse omien serverienkään kanssa kikkailla. :slight_smile:

Toimii teamspeak elisan liittymällä clienttinä, serverinä ei. Toiseen suuntaan toimii, toiseen ei.

Jos mulla on kotona oma palomuuri ja container/virtualisointiympäristö, en usko että olen oikea henkilö jolle suositella Discordia.. Mumblea käyttäisin mielummin (open source), mutta erinäisten ongelmien takia emme käytä sitä.

En tiedä onko omalla ftth liittymän ominaisuudella mitään tekemistä tämän ongelman kanssa, mutta pelatessani omalla dedicated serverillä oma yhteys katkeaa serveriin jostain syystä suhteellisen usein. Muut pelaajat maailmalta eivät tätä koe ainakaan samaan aikaan, koska olen ainoa jolle tulee “connection lost to host”. 
Tosin en ole kokeillut olisiko siltauksen kautta serverille hankitulla omalla IP:llä vaikutusta asiaan.

Kun serveri vielä oli ADSL:n päässä, niin en tätä huomannut. Olin sitte yhteydessä samasta ADSL:stä tai Telian 4G:stä.

Tein kuitenkin vikailmoituksen. Aloitetaan portinvaihdolla (se perus asentajan toimenpide.. :D) ja asentaja soittaa minulle kun käy operoimassa, jos sattuisi olemaan harrastuneisuutta ja kiinnostusta selvittämään, missä se ongelma oikeasti on. Onko noilla asentajilla edes noihin työkaluja? Vai pitääkö luottaa että täältä sisäisiä reittejä löytyisi joku tekniikan ja verkon guru, joka saa asian selvitettyä?

Vikailmoituksen aikana kaveri puhelimessa teki välipuhelun tekniikan puolelle, josta kerrottiin että porttini virheilee (en tiedä tutkiko vain minun porttia, vai oliko minun portti kaikista *ainut* joka virheili - se jäi epäselväksi) ja suositteli piuhan vaihtoa ja/tai uudelleenkytkemistä. Pieni toivonkipinä…

Kysyin kuitenkin kuinka usein sitä tapahtuu; oli viime yöltä 2 tapahtumaa klo 1:36 ja 5:27 tjsp… eli paljon harvemmalla taajuudella kuin nämä teamspeakin blackoutit joita tapahtuu käytännössä jatkuvasti. Ja korostan edelleen että nämä blackoutit tapahtuvat kun minuun yhdistetään sisäänpäin - verkko toimii moitteetta, virheettä, packetlossittomana 24/7 ulkomaailmaan kovassakin käytössä. 

TL:DR Uskon että kellarin kytkimessä joku sääntö, bugi, tai muu epähaluttu ominaisuus, joka filtteröi sisääntulevaa UDP-liikennettä (ainakin portissa 9987) aiheuttaen ärsyttäviä katkoksia.

Lisätietona että tämä Huawein kytkin ei kerennyt kellarissa olla edes täyttä vuotta, kun se jostakin syystä oli käyty uusimassa - jolloin minun yhteyteni oli muutaman kuukauden väärässä portissa perusnopeudella.. Tästä toki sain hyvitykset, ei sen puoleen, mutta mikä noissa kytkimissä on kun niin tuore piti vaihtaa heti uuteen?

Asentaja kävi vaihtamassa portin. En ole koittanut vielä teamspeakkia ajaa, pitää kiusata kavereita myöhemmin.

Onko normaalia että mtr:n ollessa UDP-tilassa kellarin kytkin jättää vastaamatta 25% ajasta ja välillä siinä menee useampi sekunti? Liitteenä molempisuuntainen mtr UDP-tilassa. Lisätietona että ICMP-tilassa useatuntiset sessiot ovat 0.0% loss.

 

Käyttäjätaso 7
Kunniamerkki +3

Peukut pystyssä että ton portin vaihdon myötä tilanne helpottaisi! Asentajat ei tokikaan noin spesifejä hommia yleensä hoitele, lähinnä hoitavat vain noi fyysiset kytkökset ja kytkimet sitä mukaa mitä tarvii ja tilataan keikkaa heiltä.

Tosta en kyllä suoraan tiedä sanoa että miksi teillä käytiin noin tuore kytkin vaihtamassa, toki oma veikkaus löytyy eli sattunut mahdollisesti vain joku maanantaikappale joka pitäny sen vuoksi käydä vaihtelemassa

Vähä epäilen että tuo portin vaihto auttaa. Siis, ongelma oli siitä lähtien kun upouusi giganen kytkin vaihdettiin, epäilin että vika oli minun raudassa - en tutkinut asiaa enempää. Nythän sinne on jo uusittu tuo kytkin jo kerran, eli vika on ollut olemassa molemmilla gigaisilla kytkimillä.

Blackout-ongelmaa ei myöskään Ciscon kytkimellä esiintynyt, vaikka siinä olikin muita ongelmia (jatkuva packet loss (ei tälläinen mysteerimäinen katkeilu siis!) / ei saanut täyttä nopeutta aina).

Ongelma tullut Huawein myötä, ja esiintynyt kahdella Huawein kytkimellä.

Epäilen konffivikaa, bugia tai muuten vain kiinalaisuutta - mutta en ole niin perehtynyt asioista että tietäisin Huawein sielunelämästä tai operaattoritason toiminnasta niin hyvin, että osaisin suoraan sanoa missä ongelma on. Mutta ei mun pitäisikään, kerroin ongelman, olen poissulkenut rautaongelmat minun puolella, pallo on nyt Elisalla. Mutta kukaan ei tiedä mitään :D

Seuraavaksi olen ajatellut viedä kaverin luo läppärin jossa teamspeak-servu ja suoraan (Elisan) kuituun kiinni, ja koittaa replikoida ongelman siellä. 

  • jos ongelmaa ei tule kaverin netillä → voiko verrata niiden kahden kytkimen konffieroavaisuuksia?
  • jos ongelma taas esiintyykin kaverilla → päätä seinään ja mokkula tilalle
Käyttäjätaso 7
Kunniamerkki +3

Jos ongelmaa ei tule kaverilla testatessa niin en pysty itse mutta löytyy kontaktit sitä varten kyllä että saadaan tiedusteltua edempää että mikäs homma :) Mikäli ongelma toistuu sielläkin niin sitten menee vähän jännemmäksi mutta rapsaa nyt siitäkin huomiot kuitenkin tänne kaiken varmuuden välttämiseksi jos saataisiin tuon varjolla asiasta irti yhtään enempää täällä puolen :)

En ole päässyt vielä kokeilemaan kaverilla, eikä minun oikeasti pitäisi tehdä tätä kaikkea selvitystyötä teidän puolesta.. Mutta katsotaan jos saan häirittyä jotakuta ja vietyä valmiiksi konfiguroidun setin heille väliaikaisesti. Siinäkin tulee ongelmaksi porttien ohjaus ja mahdollisten kuluttajareitittimien huonous, mutta eiköhän niistäkin päästä yli.

Tulin vain päivittämään että ongelma on edelleen olemassa. Sen verran jätin aloituspostauksestani spekseistä kertomatta, että kuitunousun ja palomuurini välissä oli hallitsematon d-linkin 8-porttinen gigainen kytkin. Sen ei kuitenkaan pitäisi vaikuttaa mitenkään (varsinkaan vain yhteen suuntaan), mutta se sai kuitenkin minut ajattelemaan “mitä jos...”

Nyt kytkin on korvattu HP 1810-8G:lla, ja ongelmat jatkuvat. En siis varsinaisesti ole kokeillut _suoraan_ kuitunousuun, vaan kytkimen kautta, mutta varmasti olette samaa mieltä ettei hallitsematon konfiguroimaton tyhmä kytkin pitäisi yhtään mitään vaikuttaa? Enkä halua irroittaa palvelintani ja palveluitani internetistä kokeilun ajaksi.

Aloituspostauksen kirjoitushetkellä minulla oli käytössä useampi IP-osoite, tällä hetkellä vain 1.

Saisiko jonkun oikeasti nörtin (ei siis voimatelin portinvaihtoasentajia) tutkimaan tätä asiaa?

en oo nörtti enkä minkään firman lähettiläs, joskus muinoin aikaan modeemin ja ensimmäisten langattomien aikaan törmäsin pikku juttuun, malware softa oli jättänyt takaportin auki ja sit tuli hankaluuksia, tiedät kai hard way, kaikki puhtaalta pöydältä ja langaton systeemi uusiks, tuskin tästä on mitään apua, mut who knows

Käyttäjätaso 6
Kunniamerkki +1

Sen verran spesifistä ongelmasta on kyse, että kaikki kivet täytyy kyllä kääntää asiaa selvitellessä. Valitettavasti tuo vähän vaatii myös “jumppaa” siellä kotona laitteiden ääressä asioita testaillessa. Tuo toisessa paikassa testaus tiputtaisi hyvin monta muuttujaa kuviosta pois heti, joten toivotaan että tuo jossain vaiheessa järjestyisi! Ja joo, täysin samaa mieltä tuosta, että kytkin tuskin asiaan vaikuttaa ja tuo kahdella erilaisella kytkimelläkin testaus luonnollisesti tätä tukee. :slight_smile:

Toisaalta, kun saman kytkimen takaa löytyy sinulta siis ainakin palvelin ja paljon muita laitteita, niin entäpä jos näitä tipauttelee vielä linjoilta yksi kerrallaan pois? Ettei nyt vain käy niin, että laitteet häiritsevät toinen toisiaan. :thinking: Epätodennäköinen syy, mutta melko nopeaa testata!

Tuon dlinkin takana alunperin oli pelkästään kiinni palomuuri ja toinen palvelin (pitäisi piirtää kuva verkosta, teen ehkä myöhemmin), eli siellä ei hirveästi ollut laitteita häiritsemässä. Pari päivää sitten kun kirjoitin tuosta HP:n kytkimeen vaihdosta ja ongelmien olemassaolosta, kiinni oli myös sama palomuuri ja toinen palvelin, mutta vain 1 IP-osoite, palvelimella ei oltu konfiguroitu verkkoadaptereita ollenkaan. Nyt käytössä on 2 IP-osoitetta.

Kytkin on jaettu kahteen osaan, portit 1-3 (“yks netti sisään, kaks ulos”) ja portit 4-8 lähiverkkokäyttöön, eikä näytä että missään portissa olisi virheilyä.

 

Osallistu keskusteluun