Ir al contenido principal

Como trabajar con fechas en SQL?

Este capítulo explica las dudas frecuentes al trabajar con fechas en SQL Server: tipos de datos de fecha en SQL Server y sus rangos de valores, realización de consultas sobre fechas y utilización de funciones de fecha habituales (utilizar BETWEEN, DATEPART, DATEDIFF, etc), realización de castings (cambiar datos de un tipo a otro, ej: VARCHAR a DATETIME) con CAST y CONVERT, cómo obtener la fecha actual en SQL Server (GETDATE y GETUTCDATE), utilización de la opción de configuración SET LANGUAGE, cómo obtener la fecha sin la hora, ¿Calendario Juliano o Calendario Gregoriano?, etc.

El primer factor de éxito es la elección del tipo de dato correcto para representar las fechas, que hasta SQL Server 2005, sólo podemos elegir entre datetime (01/01/1763 a 31/12/9999, con precisión de unos 3,3 milisegundos) y smalldatetime (01/01/1900 a 06/06/2079, con precisión de 1 minuto). Ambos almacenan Fecha y Hora, ya que en SQL Server 2005 (y en versiones anteriores) son los únicos tipos de datos disponibles para Fecha Hora, y no existen otros tipos que almacenen sólo la Fecha o sólo la Hora. Esto cambia en SQL Server 2008, como describo (muy por encima) en Ya está disponible SQL Server 2008 para descargar desde MSDN !!
Un error típico, es intentar cargar fechas de un origen de datos externo que contiene valores fuera de rango del que puede almacenar SQL Server. A modo de ejemplo, a continuación se muestran el rango de fechas válido en algunos motores de base de datos habituales:
  • Microsoft Access 2003 tiene un único tipo de dato Fecha Hora de 8 bytes que admite fechas desde el 01/01/0100 al 31/12/9999. Eso si... Microsoft Access no es un motor de base de datos del todo...
  • IBM DB2 también admite Fechas desde el 01/01/0001 hasta el 31/12/9999.
  • IBM Informix también admite Fechas desde el 01/01/0001 hasta el 31/12/9999.
  • MySQL admite Fechas desde el 01/01/1000 hasta el 31/12/9999.
  • ORACLE admite fechas desde el 01/01/4713 AC hasta el 31/12/9999.
  • El estandard ANSI SQL define Fechas desde el 01/01/0001 hasta el 31/12/9999.
Otro error típico, es insertar fechas en una tabla y luego hacer consultas sobre las filas insertadas utilizando el operador de igualdad sobre campos de fecha (perdón.... de fecha y hora !!). Claro, como se almacena fecha y hora, si en nuestras consultas sólo especificamos la fecha, para la hora se tomará el valor 00:00:00.000, luego o realmente almacenamos las fechas en SQL Server truncando el valor de hora-minuto-segundo-milisegundo, o tendremos que modificar nuestras consultas para obtener el resultado deseado. Este error es muy común, y suele causar bastante confusión hasta que se comprende este funcionamiento. Puede ser de ayuda utilizar el operador BETWEEN en la cláusula WHERE (ojo con BETWEEN, ya que incluirá todas las filas entre las fechas indicadas, incluyendo dichas fechas, es decir, inclusives), o bienalmacenar la fecha sin la hora (truncando la hora a la 00:00:00.000), o quizás truncar la fecha (quitando la información horaria) como se explica más adelante en este mismo artículo, etc.
Un detalle muy importante es saber cómo indicar las fechas a SQL Server, es decir, en qué formato debemos escribir las fechas en nuestras consultas. Esto, por defecto, depende de la configuración de idioma (o lenguaje) que tiene el Inicio de Sesión de SQL Server con el que estamos conectados a la Instancia. Vale la pena recordar que cada Inicio de Sésión tiene su configuración de lenguaje, y que cuando se crea un Inicio de Sesión, si no se especifica explícitamente la configuración deseada de lenguaje, se asignará la configuración por defecto establecida en la Instancia. Esta configuración la podemos cambiar dentro de un bloque de código Transact-SQL, utilizando la sentencia SET LANGUAGE. Sin embargo, quizás la mejor solución sea utilizar el formato ANSI de fechas (YYYYMMDD HH:mm:ss), y así no tener dependencias con la configuración de idioma o lenguaje (español, americano... que más da !!).
DECLARE @Fecha AS DATETIME
DECLARE @FechaHora AS DATETIME

SET @Fecha = '20080101'
SELECT @Fecha

SET @FechaHora = '20080101 15:30:00.000'
SELECT @FechaHora
Otro tema importante es cómo obtener la fecha hora del sistema en SQL Server. Para ello, podemos utilizar la función GETDATE(), o bien GETUTCDATE() si deseamos la fecha hora en UTC.
Existen otras funciones de fecha hora vitales para trabajar con fechas en SQL Server, como sonDATEPART para obtener una determinada parte de una fecha hora (el mes, el día, la semana del año, etc.), DATEDIFF para saber la diferencia entre dos fechas (se puede especificar la unidad deseada, es decir, podemos querer la diferencia de minutos, o la diferencia de horas...) yDATEADD para conocer el resultado de agregar a una fecha hora un intervalo determinado (un número concreto de minutos, o de horas, o de días, etc.). Es importante recordar que algunas de estas funciones, devuelven valores numéricos, y en consecuencia nos puede interesar realizar una casting (utilizando las funciones CAST o CONVERT) a un dato alfanumérico (ej: un casting a VARCHAR) para poder realizar concatenaciones, etc. Existen más funciones. Tanto el resto de funciones existentes, como el detalle de lo que hemos contado, está muy bien descrito en la ayuda de SQL Server, el decir, los Libros en Pantalla (BOL - Books On Line).
Una tarea muy habitual al trabajar con Fechas en SQL Server, es obtener la Fecha sin la hora, es decir, truncar la información horaria obteniendo sólo la parte de la fecha. En consecuencia, para la parte de la hora, se utilizará medianoche (es decir las 00:00:00.000). Existen varias formas de conseguir la Fecha sin la hora en SQL Server. Quizás la mejor manera, se hacer un casting de fecha a FLOAT, truncar la parte decimal (es decir, la información horaria), y hacer una casting del resultado a Fecha DATETIME o SMALLDATETIME.
-- Obtener la diferencia en días (es decir, un valor entero),
-- desde la fecha 0 y la fecha deseada,
-- y seguidamente añadir a la fecha 0 el número de días calculado previamente
-- (pero sin información horaria).
SELECT DATEADD(DAY, DATEDIFF(DAY, 0, GETDATE()), 0)

-- Obtener la diferencia en días (es decir, un valor entero),
-- desde la fecha 0 y la fecha deseada,
-- y seguidamente convertir dicho valor numérico a un valor Fecha Hora.
-- Como en las fechas, la parte decimal es la correspondiente a la información horaria,
-- conseguimos truncar la información horaria y conservar sólo la Fecha.
SELECT CAST(DATEDIFF(DAY, 0, GETDATE()) AS DATETIME)

-- Convertir un valor Fecha Hora, a una cadena de texto,
-- con la opción de estilo 112 (ISO)
SELECT CAST(CONVERT(VARCHAR(20), GETDATE(), 112) AS DATETIME)

-- Convertir un valor Fecha Hora en un valor numérico en coma flotante
-- (recordar, que las fechas internamente son números cuya parte decimal
-- es la información horaria), seguidamente truncar el valor numérico obtenido,
-- es decir, eliminar la información horaria), para finalmente
-- volver a convertirlo a Fecha Hora (pero con la información horaria sesgada).
SELECT CAST(FLOOR(CAST(GETDATE() AS FLOAT)) AS DATETIME)
Otro punto a tener en cuenta es la presentación de las fechas. Como hablamos, depende de la configuración de lenguaje del inicio de sesión actual, la cual si no nos satisface, podemos cambiar (SET LANGUAGE) o utilizar funciones de fecha y hora. Sin embargo, como esto en ocasiones resulta algo engorroso, puede ser útil utilizar la función CONVERT especificando un formato de estilo (consultar los Libros en Pantalla para más información), como en el siguiente ejemplo: SELECT CONVERT(VARCHAR, GETDATE(), 103).
En cualquier caso, recordar que en muchas ocasiones el trabajo de presentación es realizado por las aplicaciones cliente (Web o Win) o por las herramientas de Reporting utilizadas (Crystal Reports, Reporting Services, Actuate, etc.).
¿Calendario Juliano o Calendario Gregoriano? El Calendario Juliano fué implantado en el año 46 antes de Cristo, hasta que posteriormente fué sustituido por el Calendario Gregoriano(ojo, en cada país se impuso el Calendario Gregoriano en un momento del tiempo distinto, es decir, no se cambió de calendario en todos los países el mismo día...). ¿Y esto que nos importa? pues principalmente, que el cálculo de los años bisiestos es diferente, en función de que nos ajustemos al Calendario Juliano o al Calendario Gregoriano. Por ello, puede resultar útil saber cómo se gestionan los años bisiestos en nuestra base de datos ¿verdá? Por ejemplo:
  • SQL Server utiliza el Calendario Gregoriano.
  • DB2 utiliza el Calendario Gregoriano.
  • ORACLE utiliza el Calendario Gregoriano para las fechas posteriores al año 1582, pero utiliza el Calendario Juliano para las fecha anteriores.
En consencia, podemos encontrar situaciones peculiares. Por ejemplo, el día 29/02/1300 es una fecha válida en ORACLE, mientras que en DB2 resulta una fecha inválida, al tratar el año 1300 como no bisiesto.
Por último, aprovecho para referenciar otro Artículo de gran interés relacionado con trabajar con Fechas en SQL Server, que trata en particular de trabajar con Tablas Versionadas (es decir, tablas con históricos de datos que almacenan múltiples versiones con campos Fecha Desde y Fecha Hasta). Se trata del artículo Trabajar con tablas versionadas (Fecha Desde y Fecha Hasta) en SQL Server, Slowly Changing Dimension (SCD) Tipo 2, y en el se explica el funcionamiento de las tablas versionadas Slowly Changing Dimension (SCD) Tipo 2, la problemática de la utilización de tablas versionadas SCD Tipo 2, consultas SQL sobre tablas versionadas SCD Tipo 2, cómo denormalizar tablas versionadas SCD Tipo 2, cómo comprobar que no existe solapamiento de versiones en tablas versionadas SCD Tipo 2, etc. Un artículo de gran interés, al tratarse de una problemática muy común de bases de datos, que nos encontraremos especialmente en sectores de Banca, Seguros, Telecos, etc., y en general en cualquier aplicación de gestión un poco en condiciones. En consecuencia, también resulta de gran interés su explotación en entornos de Data Warehouse (DW) y Business Intelligence (BI), tanto para Reporting como para OLAP.

Comentarios

Entradas populares de este blog

¿Qué es el nivel de aislamiento (Isolation Level) de una Transacción? ¿Qué niveles de aislamiento ofrece SQL Server?

Esta capítulo explica qué es el nivel de aislamiento (isolation level) de una transacción, el comportamiento de SQL Server en operaciones de lectura o de escritura, se detallan los diferentes niveles de aislamiento basados en bloqueos (READ UNCOMMITTED, READ COMMITTED, REPEATABLE READ, SERIALIZABLE) y los niveles de aislamiento basados en versionado de filas (READ COMMITTED SNAPSHOT, SNAPSHOT), se explican los males de la concurrencia (lecturas sucias, lecturas no repetibles, lecturas fantasma, y conflictos de actualización), como establecer el nivel de aislamiento deseado (SET TRANSACTION ISOLATION LEVEL y las opciones de base de datos READ_COMMITTED_SNAPSHOT y ALLOW_SNAPSHOT_ISOLATION), cómo conecer el tiempo máximo de bloqueo (@@LOCK_TIMEOUT) y como establecer el tiempo máximo de bloqueo (SET LOCK_TIMEOUT), etc. El nivel de aislamiento de una transacción (transaction isolation level)  define el grado en que se aísla una transacción de las modificaciones de recursos o datos...

Aumentar y Reducir la TempDB en SQL Server?

Una buena práctica después de instalar SQL Server (y que interesa revisar periódicamente) es tener bien dimensionada la base de datos TEMPDB, es decir que el  tamaño inicial de TEMPDB  sea suficiente, y en consecuencia no sea necesario que TEMPDB crezca ni tampoco reducir TEMPDB (SHRINK). Esta artículo explica brevemente  para qué sirve TEMPDB , explica camo cambiar el tamaño inicial de TEMPDB (aumentar o reducir),  cómo reducir TEMPDB , cuántos ficheros son recomendables para TEMPDB, etc. ¿Para qué sirve TEMPDB?  La base de datos TEMPDB es un elemento de gran importancia en una Instancia de SQL Server, ya que  TEMPDB es la encargada de almacenar tanto los objetos temporales  (tablas temporales, procedimientos almacenados temporales, etc.),  como los resultados intermedios  que pueda necesitar crear el motor de base de datos, por ejemplo durante la ejecución de consultas que utilizan las cláusulas GROUP BY, ORDER BY, DISTINCT, etc. (es d...

¿Qué es el Modo de Recuperación o Modo de Registro? Modos de Recuperación Simple, de Registro Masivo (BulkLogged), y Completo (Full). Operaciones de Registro Mínimo

El  Modo de Recuperación , también conocido como Modelo de Recuperación ó Modo de Registro, es una opción de configuración de base de datos que indica  cómo se gestiona el uso del LOG de Transacciones  de SQL Server para dicha base de datos (esta opción se configura para cada base de datos de forma independiente). En función de la configuración del Modo de Recuperación debemos  elegir la estrategia de Backup y Restauración de SQL Server  (o viceversa), y podremos mejorar el rendimiento de ciertas operaciones denominadas Operaciones de Registro Mínimo , minimizando las escrituras en el LOG de SQL Server (y en consecuencia, minimizando el tamaño del LOG de SQL Server). El Modo de Recuperación o Modo de Registro de SQL Server (Recovery Model) es quizás una de las configuraciones de base de datos más sensibles, y quizás una configuración relativamente desconocida: muchos conocen que existe la configuración de Modo de Recuperación en SQL Server, pero no se tiene...