Diario de SQL Server

Un DBA a merced de los vientos (1 de varios)

Escrito por qwalgrande 20-04-2011 en General. Comentarios (1)

 

En estas últimas semanas, en las que la naturaleza, a base de terremotos y tsunamis, ha puesto en su sitio a un hombre que la desafía con centrales nucleares, hemos vuelto a oír una frase más propia de una aventura de Homero, que del siglo XXI:

 

"Si los vientos nos son propicios…"

 

Pues sí, en esas estamos, es una desgracia, pero es lo que hay, y es sinónimo de la más completa pérdida del control de una situación.

 

Llevándolo al mundano plano de la vida de un DBA, son un buen montón de situaciones las que nos dejan así, a merced de los vientos, confiando en que la fortuna. Los hay que hasta rezan o hablan de ponerle velas a los santos. Y desde luego que uno puede hacer mucho por detectar el golpe y minimizar los daños, pero vamos, ni por ésas. Voy a poner una de esas situaciones en las que eso ocurre y qué puede hacer uno para prepararse ante esas circunstancias, además de aceptarlas con resignación.

 

1.- Enfermar. Es evidente que es algo que no está en manos de uno, aunque una vida y hábitos saludables influyen mucho. Lo curioso es que a mí en concreto, que llevo una mala racha importante, me dicen "Alberto, tienes que comer más", a lo que yo no respondo, pero pienso "Y trabajar menos". Cuando vas teniendo una edad que empiezan a parecer dos, hay que cuidarse más. Porque, aunque no sé aún cómo y sólo tengo pruebas empíricas, los sistemas SABEN CUÁNDO ESTÁS DÉBIL, y lo aprovechan, lo huelen como dicen que los perros huelen el miedo.

El caso es que una vez que enfermas, sólo queda confiar en el resto del equipo te respalde, porque tendrás que combatir en inferioridad de condiciones, algo que por otra parte no debe impedir nuestra victoria, siguiendo con nuestra filosofía "Always On". Ojo, también saben cuándo enferman las personas de tu entorno familiar, así que no basta con comer una manzana al día, procura que tu equipo pueda respaldarte y sepa cómo. Fórmales, documenta (sí, ya, y la luna), oblígales a llevar ellos una vida saludable también y, sobre todo, pide refuerzos.

 

2.- El almacenamiento. Ahora que estoy en un, como siempre traumático, procedimiento de cambio de almacenamiento (cambio de tecnología, marca, modelo y todo lo demás), me viene a la mente el símil de los coches. Hace unos años, cualquiera que fuera un poco mañoso, no es mi caso, sabía cómo reparar un embrague, así como otra serie de averías menores. Ahora, sólo hay un tipo de avería: fallo en la electrónica. Hay que llevarlo a un taller para que lo miren, no gratis. Molesta porque lo que allí hacen parte de conectarse al coche por una especie de puerto USB, para que una aplicación muestre en pantalla "Error -998: Embrague defectuoso". Pero claro, tú no tienes ese cable ni ese software tan estupendo. Evidentemente no es así, pero imagino que no ha de ser muy diferente.

Con las cabinas cada vez me veo más en esa línea. No es que nunca haya entendido mucho, pero uno podía decir "RAID 1 para el log, RAID 5 para el data". Ahora no, ya todo son "especies de RAID megacomplejos y supereficaces". Lo que tenemos, o al menos a mí me lo parece, son enormes cajas negras en las que uno no tiene ni un triste log de errores normal que mirar. Hay que llamar al "experto" de la casa siempre. Lo de las comillas no es casual. Antes sabías que los discos se rompían y bueno, tenían que romperse dos discos para perder datos. Si bien la ruptura de uno podía provocar la del espejo, había a qué agarrarse. Ahora, no pasa nada, puedes perder bandejas de discos enteras y ni enterarte. Sólo te enteras de que el servidor de bases de datos dejó de ver los discos, no uno ni una bandeja, todos, por "errores oscuros que sólo el experto conoce", algo que pasa, y mucho, a pesar de que te perjuran de que es imposible para, justo después y rápidamente, reconducir a "el Windows". Oh, qué gran excusa, ¿por qué no se me habrá ocurrido a mí eso? ¿Y por qué todos los técnicos de almacenamiento dicen "el Windows", en un tono despectivo? ¿Hacen lo mismo cuando el sistema operativo es Unix, dicen "el Unix"? Tendrían que tratarle con más cariño, ya que es el comodín que les queda, al menos conmigo. Su otra baza es "el SQL", pero ahí a mí no me pillan nunca, porque SQL Server sí suele dejar datos reveladores de las circunstancias que le suceden. El resumen es que, al menos yo, sólo puedo confiar en que no le pase muchas veces, porque cada vez que pasa estoy vendido.

Sobre las cosas que podemos hacer frente a este tipo de circunstancias, están apuntar las cosas en un cuaderno y no en discos, o si no, dado que la comprensión se antoja quimérica, al menos llegar a un punto de conocimiento de los problemas típicos que puedan sucederle al almacenamiento para poder reaccionar de una forma ágil (antes de que volvamos a cambiar de cabinas). Por supuesto, toma datos y guárdalos (estadísticas de esperas, contadores de rendimiento, etc.), porque hará falta justificarse ante esas imposibles cosas que suceden y que tan claramente dejan registrados tus propios logs. Frente a los técnicos de almacenamiento, todavía no tengo ni remedios paliativos ni vacuna. Quizá sea como ante la radiación, la única protección válida son las barreras físicas. Y bueno, otra opción es conseguir que sea el problema de otro, es decir, pasarse a SQL Azur, si bien ahí tienes limitaciones tales, en cuanto a tamaño esencialmente, que quizá sea un pelín pronto. Con 50 Gb por base de datos, poco margen de migración existe si tenemos un sistema de cierta entidad entre manos.

 

3.- Los service packs y otros parches de sistema operativo. (n.a.: El traductor ortográfico me ha sustituido "los services packs" por "los serviles pacos". ¿Alguien puede reproducir ese comportamiento?). Cada vez que toca instalar un service pack en un servidor crítico, me acongojo. La situación suele ser también de salto al vacío. No hay nada que invite a pensar que algo puede ir mal, pero de hecho pasa. No suelen ser tampoco errores catastróficos, sino sutilezas, normalmente un permiso extraño, una política que cambia, un valor por defecto que no se modifica. Suficientemente oculto como para que las pruebas en entornos no productivos no lo saquen a la luz. Suficientemente leve como para que no se decida dar marcha atrás y desinstalarlo (¿y venir otro sábado? Uff, no, eso lo penúltimo). Pero podrá torturarte durante meses. Prestad especial atención a los service packs recién salidos del horno, que pueden salir rana. La última vez (SP1 de W2K8 R2) piqué como un borrego. Yo pretendía ponerlo antes de pasar un servidor a producción por ahorrarme el malísimo trago. Por circunstancias no se pudo instalar y justo la misma semana se publicó que venía con taras.

La forma de esquivar estas eventualidades pasa por contar con entornos de testing similares a los productivos y usarlos. Ponerlos en los entornos de pruebas en ocasiones puede ayudar, siempre que se usen y se parezcan al entorno de producción. Digamos que es el mínimo. Otras precauciones, no muy útiles normalmente, son hacer una pequeña búsqueda por internet para ver qué problemas ha planteado el service pack en otros entornos o abrir un prewarning con MS. En cualquier caso, sobre todo con los parches de seguridad, es mayor el riego de no poner los parches que el de ponerlos. La instalación de los service packs sí quizá requiera de algo más de preparación y meditaciones.

 

Como esto en vez de un post empieza a parecer una tesina, voy a dividirlo en varios. Seguiremos con el punto 4, la monitorización no monitoriza.

Agenda PASS Spanish Group – Primer semestre 2011

Escrito por qwalgrande 04-04-2011 en General. Comentarios (0)


A continuación os detallo la agenda de los diversos Webcasts que impartiremos desde PASS Spanish Group en el primer semestre de 2011. Todos ellos se impartirán en directo el día indicado a las 19:00 (GMT+01:00, Madrid, París). También os incluimos el link de registro para cada uno de ellos. Esperamos que os resulten interesantes.

 

Cómo funciona el Query Optimizer

Descripción: Esta sesion describe cómo funciona el Query Optimizer y los pasos más importantes que SQL Server ejecuta desde que recibe un query hasta que un plan de ejecución es generado.
Ponente: Benjamín Nevarez

 

Cómo gestionar eficientemente las BBDD de una instalación Sharepoint 
Descripción: En esta sesión analizaremos los aspectos fundamentales que debemos de tener en cuenta a la hora de desplegar un entorno de SharePoint 2010, desde el punto de vista de un DBA de SQL Server. 
Ponente: Antonio Soto

 

Optimizando procesos ETL con Integration Services

Descripción: Sesión práctica donde se verán diversos paquetes de Integration Services en los que se utilizan buenas prácticas de diseño y optimización de los paquetes aplicadas a cargar tablas de staging, de dimensiones y de hechos, obteniendo trazabilidad de todo lo ocurrido.

Ponente: Salvador Ramos

 

PASS, asociación de profesionales

 Descripción: Las siglas PASS significan asociación de profesionales de SQL Server. No es sólo SQL Server, estamos hablando de una profesión, la de administrador y/o desarrollador de bases de datos, un oficio apasionante pero duro, estresante y muy exigente en ocasiones. Y es una asociación en la que buscamos colaborar entre todos.

Ponente: Alberto López Grande

 

Desplegando datos Geo Espaciales en Reporting Services 2008 R2

Descripción: Uno de las mejores características que tenemos en la nueva versión de SQL Server (2008 R2) es poder generar reportes de nuestros datos Geo-Espaciales sin necesidad de comprar herramientas especializadas.
Ponente: Jesús Gil

 

¿Nuestra solución de SSAS va lenta? Comenzando con la optimización de Analysis Services 2008 
Descripción: Cuando nuestro requisito principal es analizar nuestra información de la forma más rápida posible es cuando entra en juego la utilización de buenas prácticas dentro del modelo multidimensional.
Ponente: Rubén Pertusa


 

SQLRAP, mi punto de vista

Escrito por qwalgrande 02-04-2011 en General. Comentarios (0)

En el último mes, he tenido dos SQLRAP. Es una revisión de un entorno crítico de SQL Server realizada por Microsoft (más concretamente por sus PFE). Nunca me gustaron este tipo de auditorías precocinadas, ya que se suelen limitar a pasar una batería de scripts y a dar conclusiones que, en la mayor parte de los casos, son cosas sobradamente conocidas. Si el entorno no está bajo ciertas condiciones de administración, te viene a demostrar que eres un desastre. Si por el contrario, es un entorno vigilado, administrado adecuadamente, te saca los colores por una pocas cosas, pero tampoco por tantas. Curiosamente, si en tu entorno tienes bases de datos de Sharepoint, sólo por eso tendrás numerosas alertas de todo tipo.

 

En este caso, no me quedaba más remedio que pasarla porque era un requisito para el inicio de un contrato de soporte BeSpoke (ya tendré tiempo de hablar de él más adelante). Una vez observado el resultado, bueno, desde luego que no pagaría por él, pero sí que puede ser de utilidad.

 

La revisión tiene muchas cosas buenas, porque también evalúa gran cantidad de cosas del sistema operativo, buenas prácticas de todo tipo y una entrevista en la que uno tiene la oportunidad de pararse a ver qué hace bien y qué hace no tan bien. Y el que pregunta sabe de lo que habla. Luego hay un informe muy completo y muy práctico, así como un resumen ejecutivo, para que los jefes sepan también lo que hay. Quizá sea este el aspecto más significativo y que mayor utilidad puede tener, ya que es frecuente que uno pueda estar años clamando por algún aspecto o varios (formación, más personal, etc) sin éxito. Que venga MS a decírselo al que manda, suele ser bastante efectivo.

 

Luego, también tiene sus deficiencias. Sólo te dice lo que está mal, pero no lo que está bien, siendo una información que se posee y que tendría un gran valor a modo de documentación del entorno. Como producto enlatado que es, no te permite que se estudie en más profundidad aspectos concretos que puedan interesarte ni descartar otros que no te interesa que se estudien. Los tiempos de medición son muy cortitos también, por lo que las conclusiones que se obtienen son muy relativas, salvo que existan problemas flagrantes. En muchos aspectos, no aporta conclusiones, sino que más bien es un punto de partida para un trabajo.

 

Y por último, como casi siempre, el técnico de turno que te toca influye, y mucho, a la hora de realizar cualquier tipo de acción, ya sea un caso de soporte, una auditoría o lo que sea. Y en este caso, siempre te va a tocar uno que sabe, porque los tres saben, y mucho.