Forum moderators:
Korzuk, DeDinc, Техподдержка Сети, Ханя
|
5/27/2009 4:08:05 PM
/
1989 messages
/
the topic was opened by mike_stalker
.
|
|
Сегодня состоялась встреча капитанов по поводу упавшего во время игры движка. Отсюда возник вопрос: по какой причине после первого "падения"="непингования" en.cx примерно в 19-30 (жмт +6) 17го апреля нельзя было сразу перевести на резервный айпишник? и известить организаторов активных игр. зачем надо было ждать разгара большинства игр (движок окончательно "упал" в 23-55 (жмт+6)?
|
я думаю администрация даже и не догадывалась что он падал, а вот когда упал полетели звонки со всех концов
|
прекрасно она знала. мы извещали ее об этом личным сообщением в ЕН-почту.
|
ен почту видимо читают меньше, смс либо звонки в снг нужно было совершать.
|
Сайт мониторится каждую минуту, и если страница на сайте открывается более чем за 5 секунд, мне и Сергею приходит смс-сообщение об этом. Т.е. даже когда сайт работает, но подтормаживает, мы тоже об этом знаем. И мы сразу начинаем смотреть что случилось.
В субботу когда сервер стал недоступен, мы конечно же сразу об этом узнали и начали искать причину. На это ушло примерно 1,5 часа. Когда мы наконец-то поняли что проблема именно с конкретным IP адресом (а в голове это никак не укладывалось), тогда и было принято решение переключиться на другой IP.
Про пингование сайта вообще забудьте. Пинги и сейчас не работают - они просто отключены у нас. И что из-за этого сайт по вашему не работает?
|
Konstantin: В субботу когда сервер стал недоступен, мы конечно же сразу об этом узнали и начали искать причину. На это ушло примерно 1,5 часа. Когда мы наконец-то поняли что проблема именно с конкретным IP адресом (а в голове это никак не укладывалось), тогда и было принято решение переключиться на другой IP. Сугубо для опыта - а в чем была причина такого отказа? С сетями работаю давно - такого не встречал. Подозрения есть на то, что причина была в самозадрачивающемся контуре где то у прова на маршрутах, хотя трассировка этого не показала(в принципе могла и не показать, если так отвалился целый сегмент, а не только один наш ИП, да и с мобильника это не особо проверишь полноценно :) ) но хотелось бы узнать точно, с чем есть вероятность столкнуться. Если не сложно - в личку скинь плиз ответ.
|
porych, я так и не знаю в чем была причина неработоспособности IP адреса, дата центр причину так и не сказал. Может быть они еще кому-то в сети такой IP адрес выдали, и из-за этого их маршрутизаторы могли запутаться, а может еще что-то.
Ситуация у нас была такая. Мы видим что сервер работает, но законектиться к нему не можем. Перезагрузили. Результата нет. Сразу думали может быть хардварный файрвол заглючил. Отключили файрвол, сервер все равно не доступен, хоть и работает. Хер с ним. Запускаем запасной сервер. Назначаем ему наш IP. Новый сервер сразу становится недоступен. Блин. Мысли: может быть ddos атака. Включаем хардварный файрвол и открываем доступ только для моего IP и IP Сергея. Все равно сервер не виден. Запускаем еще один новый сервер, но уже с виндой, вместо linux-а. Тоже самое. Сервер пропадает. Становится понятно, что какому бы серверу мы не назначили наш серверный IP адрес, сервер сразу становится недоступен даже по локальному IP внутри сети.
Тогда мы взяли новый IP адрес и промапили его на наш сервер. IP адрес в ДНС-ах для домена en.cx изменили на новый, но обновление ДНС по всему миру занимает до 2-х дней. Тогда взяли другой домен, которым никто не пользуется en-world.org и прописали ему новый IP.
Иван сделал смс-рассылку всем владельцам доменов, а потом и всем авторам всех доменов.
А через примерно 2,5 часа уже и старый IP сам по себе заработал.
Сейчас ситуация такая. От проблемного IP адреса мы избавились вообще. Все домены ***.en.cx промапили на 79.125.20.11 Все домены ***.en-world.org на 79.125.20.43 79.125.20.11 и 79.125.20.43 два разных сервера. Еще 79.125.20.43 заменим на какой-нибудь в другом сегменте.
Если вдруг опять IP будет недоступен, то по второму домену можно будет зайти на сайт.
Ну и еще два зеркала сейчас делаем, это ***.encounter.cx и ***.encounter.ru с разными ДНС серверами, уже что бы наверняка.
|
(
)
[
4/21/2010 7:25:23 PM (UTC +3), en.cx
]
а en.ru и en.com сильно дорого? Дуров жи се позволил vk.com :)
|
(
)
[
4/21/2010 8:19:30 PM (UTC +3), en.cx
]
с цитированием и редоктирование, чето не то :( почените!!
|
иногда во время игры если жмешь обновление, и если есть автопереход, то автопереход не срабатывает. время вверху не отображается
|
(
)
[
4/21/2010 11:06:21 PM (UTC +3), 56.en.cx
]
Костя, а что было с endata.cx - картинки в играх были доступны?
|
Да, были доступны. Это ведь отдельное хранилище, повышенной надежности (как обещает Дата Центр).
|
Перебейте, что ли, ссылки на фотографии в старых публикациях.
Пример, например. Фанатам фапать не на что.
|
}i{YI{: доменные имена тут ни при чем. Примапь ты наш сервер хоть к i.am.the.best.game.in.the.world.com - один хрен. Если какие то неполадки в сети, будет тоже самое. Konstantin: рискну предположить, что это сработала какая то блокировка IP-адреса на оборудовании дата-центра, из за чего IP-адрес стал недоступен, и соответсвенно чему бы его не присвоили - картина была таже самая. Политики блокировки знают только админы дата-центра(искренне в это верю во всяком случае). Есть смысл глянуть что валилось с сервера(IIS, Apache, nginx) на тот момент, когда он перестал быть доступен минус 5-7 секунд до этого. Хотя следы подмены MACа, ARP-флуда и прочих прелестностей там видны не будут. Это видно будет только в логах оборудования прова(если включено логирование). А то, что спустя какое то время все восстановилось само собой - лишнее подтверждение. Тем более если это какой то точный промежуток времени.
|
(
)
[
4/22/2010 9:23:12 AM (UTC +3), en.cx
]
я прекрасно знаю что такое доменное имя и что такое днс ) жук не совсем ламер, у жука просто образования не хватает
я ктаму что для зеркала при збое, для простого юзера проше обьяснить как перебить в адресе cx на ru чем en на encounter
|
[
4/22/2010 12:01:01 PM (UTC +3)
]
porych: Есть смысл глянуть что валилось с сервера(IIS, Apache, nginx) на тот момент, когда он перестал быть доступен минус 5-7 секунд до этого. Смотрели все что можно было - ничего подозрительного - все в обычном режиме.
|
}i{YI{, домен en.ru стоит 55 тыс евро. Я уже узнавал.
|
за сущие копейки )) все дело в том чтобы это все было в разных местах, иначе смысла нет. вон у нас сервак городского форума сгорел, а бекап находился этажом ниже. думаю дальше все понятно
|
Хммм...тут вспомнилось...один раз была похожая ситуация. На windows server 2008. После автообновления, когда винда на сетевые встроенные то ли прошивку новую влила, то ли драйвер - отвалисись нахрен по такой-же причине. Точнее как. Почему то после обновления у сетевух поменялся MAC-адрес. А на комутаторе стояло разрешение только старым MACам. Пришлось перенастраивать комутатор. Какая сетевуха уже не упомню - вроде бы интыль какой то гигабитный. }i{YI{: подход понял ))) Ни на что не намекал :)
|
Кстати, а связка DNS Round Robin + кластеризация БД не прокатит? Для разных ДЦ вроде даже вариант приемлимый.
|
|
|
|