Dirección
Calle 135 #15-45
Bogotá, D.C. Colombia

Horario de Trabajo
Lunes a Viernes: 9AM - 6PM

gcortes@alfil.com.cogcortes@insetron.com

Cuando se diseña un sistema de Vigilancia o Supervisión basado en video, se comenten errores que se traducen en insatisfacción por parte de usuario final. En esta ocasión quiero mostrar los pasos a seguir para calcular la resolución adecuada de la cámara (Análoga o IP) que usemos.

Cuando las personas asisten a los cursos que dicto con ALAS (www.alas-la.org) aprenden que se deben hacer muchos cálculos. Por ejemplo, saben que se debe calcular la distancia focal del lente, pero por pereza, descuido, negligencia, costumbre o simple ignorancia, nunca los hacen. También saben que la resolución de la cámara depende del nivel de detalle con que se desea ver determinada imagen, pero tampoco hacen el cálculo que debe estar basado en la densidad de píxeles y entonces, neciamente terminan instalando un sistema de video vigilancia con la cámara y el lente más económico que su distribuidor le ofrece, para darse cuenta al final que no era la escena que deseaba y mucho menos la resolución que necesitaba. El sentimiento de frustración del usuario final es lo único que queda para recordar y las futuras adquisiciones de tecnología se ven seriamente afectadas.

En dónde está la falla? Nace mucho antes de instalar los equipos. Los errores se cometen casi siempre en la etapa de diseño.

Después de hacer un análisis de riesgos y crear los criterios de diseño, se debe descubrir con exactitud, qué se busca con el sistema de CCTV. Es la base fundamental del proceso.

Basémonos en tres (3) Ejemplos para dar algo más de claridad.

Ejemplo 1. Cámaras para identificar posibles ladrones en un banco,

Ejemplo 2. Cámara para saber si el banco está lleno de clientes.

Ejemplo 3. Cámara para registrar las operaciones financieras en efectivo de una caja.

Son escenas muy diferentes que se ven afectadas por muchos factores externos pero que definitivamente usan lentes y cámaras con resoluciones distintas.

Revisemos, en el primer caso necesito una imagen clara de las acciones que los clientes están haciendo en cada área del banco. En el segundo caso necesito una imagen general de toda el área de atención a clientes y en el tercer caso necesito una imagen que me permita ver con mucho detalle los billetes que se entregan o reciben a un cajero.

Cuál es la diferencia fundamental? Es simplemente que tan cerca o que tan lejos deseo ver la actividad que me interesa en cada caso. Esto se soluciona en primera instancia, haciendo un cálculo adecuado de la longitud focal del lente a usar.

LA REALIDAD

Pero recordemos que cuando sucede un siniestro o un evento de excepción todos queremos ver el detalle de la escena lo más grande posible, por lo tanto en la vida real se usa mucho la capacidad de agrandar o extender en todo el monitor la imagen, a lo que normalmente le llamamos el “zoom digital”. Es en este punto donde la resolución de la cámara es fundamental para seguir ganando información útil para labores forenses e investigativas.

En este punto, se falla muy seguido, ya sea porque la cámara usada no tiene la resolución suficiente o porque no se grabó a la resolución nativa.

EL PROCEDIMIENTO

Entonces le recomiendo que tenga muy en cuenta el proceso general que debe seguir:

  1. Determine que desea ver exactamente con cada imagen.
  2. Calcule la distancia focal del lente que le permita ver claramente la escena deseada.
  3. Basado en el concepto de densidad de píxeles, determine la resolución mínima de la cámara.
  4. Mantenga la resolución de la imagen en todos los dispositivos por donde pase la imagen.

Revisemos los principios básicos de cada parte del proceso:

a) DETERMINE QUE DESEA VER EXACTAMENTE CON CADA IMAGEN

Aunque pudieran existir muchos más usos, le recomiendo que descubra si su aplicación puede clasificarse en alguna de las cuatro siguientes:

  1. Detección, los cuerpos de las personas en la escena pueden ser bastante pequeños (se recomienda entre el 5 y el 10% del total de la imagen).
  2. Medir Ocupación, se requieren objetos o cuerpos con un tamaño de al menos el 20% de la escena.
  3. Reconocimiento, se necesita que el cuerpo de la persona sea de casi el 60% de la imagen, por lo tanto su cara puede estar al 10 o 15% de la imagen, suficiente para reconocer a alguien que ya se conoce.
  4. Identificación, el detalle del objeto de interés debe estar al menos al 40% de la imagen total, por lo tanto si la idea es identificar a una persona que no conocemos, su cara debe ocupar el 40% de la escena o si deseamos contar billetes, las manos y el área inmediata de conteo, debe ocupar el 40% de la escena.

b) CALCULE LA DISTANCIA FOCAL DEL LENTE

En ediciones anteriores hemos descrito el procedimiento para calcular el lente, por lo tanto asumo que usted ya sabe cómo hacerlo. Recuerde que dependemos de tres factores a tener en cuenta:

  1. Tamaño del objeto que deseo ver. Mido con exactitud el área (vertical x horizontal) que deseo ver, de acuerdo al uso que le voy a dar al sistema de CCTV (respuesta al paso anterior).
  2. Distancia de la cámara al objeto que deseo ver. Se debe medir desde la punta del lente, hasta el centro del plano imaginario que deseo ver en la imagen de video.

Formato de la cámara que voy a usar. Busco en la cámara seleccionada, que formato tiene. (La cámara se escoge de acuerdo a las características externas de la escena como nivel de luz, rango dinámico, alimentación eléctrica, ajustes de color, entre muchos otros factores).

Ejemplo 3.

Si deseamos ver el detalle de los billetes en una transacción bancaria, el tamaño del objeto es el área donde normalmente el cliente cuenta el dinero frente al cajero que se lo entrega. Algo que no pasa de 80 centímetros de ancho (A) por 60 centímetros de alto. Fijémonos que al tener una escena de ese reducido tamaño, los billetes (20 cmts) se ven fácilmente y pudiéramos contarlos.

Para finalizar el cálculo debemos asumir algunos datos: Supongamos que la cámara está detrás del cajero a una distancia de 4 metros horizontales y una altura de 3 metros. Recordando a Pitágoras, descubrimos que la distancia de la cámara al objeto que deseo ver, puede ser de 5 metros (D). Asumamos que la cámara con la que trabajemos tiene un formato de 1/3”, por lo tanto su tamaño es de (4,8 mm (a’) x 3,6 mm). Esto se consigue en las tablas de tamaños de elementos fotosensibles de las cámaras.

Entonces recordemos la fórmula: f=Dxa’/A = 5×4,8/0,8 = 30mm. Por lo tanto requerimos un lente de 30 mm aproximadamente para este caso.

Ejemplo 2.

Sin embargo si lo que deseamos en saber si el banco está muy lleno de clientes, entonces necesitamos una escena en donde se vea toda el área de filas y espera, que puede variar de acuerdo a la disposición arquitectónica de cada sucursal. Para seguir en el ejemplo, asuma que necesitamos un área de 6 metros de ancho. En esta escena no nos interesan los detalles de cada cliente, sino el poder contar las personas en espera.

Supongamos que la cámara está a una distancia de 5 metros del plano imaginario y que usamos una cámara de 1/3”.

Entonces retomando la fórmula: f=Dxa’/A = 5×4,8/6 = 30mm. Por lo tanto requerimos un lente de 4 mm para este caso.

c) DETERMINE LA RESOLUCIÓN MÍNIMA DE LA CÁMARA

Para hacer esto debemos recurrir al concepto de densidad de píxeles. Esto es la mínima cantidad de píxeles por unidad de longitud, que requiero en una imagen para poder distinguir detalles. Nuevamente depende del uso que le vaya a dar a esa imagen. Es un concepto que también hemos tocado en otras ediciones anteriores.

Debo aclarar que las tablas de densidad de píxeles, están basadas en la experiencia y subjetividad de diferentes fabricantes… por lo tanto no hay una estandarización al respecto, pero también es bueno aclarar que las pruebas que se han hecho y los resultados son similares.

Por ejemplo, algunos fabricantes han sugerido que para poder leer claramente la placa de un vehículo, necesito 300 píxeles por metro. Otros que para poder identificar un rostro humano requiero 350 píxeles por metro. O que para poder contar cuerpos  requiero 70 píxeles por metro, mientras que para poder contar detalles requiero 250 píxeles por metro.

Estos datos varían en las tablas que suministra cada fabricante, pero al final los resultados son muy afines.

Ejemplo 1

Para determinar posibles acciones delictivas de un humano en un banco requiero 250 píxeles por metro. Necesito una cámara que vea toda la escena general del banco, en donde posiblemente vea el área de espera, el área de cajeros y las ventanillas de información general o atención especial.

Supongamos que la escena tiene 10 metros de ancho, que la cámara está a una distancia de 7 metros y que usamos una cámara de 1/3”.

El lente que debo colocar es: f=Dxa’/A = 7×4,8/10 = 3,4mm. Por lo tanto requerimos un lente de 4 mm para este caso.

Al obtener esa imagen en un monitor, vemos que podemos una amplia zona del banco, sin embargo sabemos que para poder ver acciones delictivas necesito 250 píxeles por metro, por lo tanto haciendo una sencilla regla de tres, descubro que esa imagen debe tener: píxeles horizontales = 10 metros x 250 píxeles = 2500 píxeles, en el sentido horizontal.

Si asumo que la cámara tiene un formato 4:3, como el estándar NTSC, entonces haciendo otra regla de tres, puedo saber cuánto debe tener esa misma imagen verticalmente. Píxeles verticales = Píxeles Horizontales x 3 / 4 = 2500 x 3 / 4 = 1875 Píxeles, en el sentido vertical.

Luego la resolución de la cámara debe ser 2500 píxeles horizontales x 1875 pixeles verticales = 4,7 Mega píxeles.

Fijémonos, que para poder ver (haciendo un zoom digital) un acto delictivo en esa escena, requiero no solo de un cálculo de lente, sino de un cálculo de resolución. Esto es lo que realmente me permite ver la información deseada con claridad.

Ejemplo 2

Para el uso de Medir Ocupación o saber si el banco tiene muchos clientes, requiero 70 píxeles por metro, por lo tanto retomando la imagen obtenida con el lente de 4mm tenemos una escena de 6 metros, que deberá tener 420 píxeles horizontales y por lo tanto deberá tener 420 píxeles x 3 /4 = 315 píxeles verticales, para una resolución total mínima de 0,13 Mega Píxeles.

Si nos damos cuenta con una cámara de baja resolución (0,4 Mpx) es suficiente para esta aplicación.

Ejemplo 3

Para ver detalles muy precisos, como contar dinero, requiero 350 píxeles por metro, por lo tanto retomando la imagen obtenida con el lente de 30mm tenemos una escena de 0,8 metros, que deberá tener 280 píxeles horizontales y por lo tanto deberá tener 280 píxeles x 3 /4 = 210 píxeles verticales, para una resolución total mínima de 0,06 Mega Píxeles.

Nuevamente con una cámara de baja resolución es suficiente.

ANÁLISIS ESPECIAL

Pero entonces podríamos para este caso pensar en otra solución, que tal si no usamos un lente tan largo (30 mm) sino uno mucho más amplio, e incrementamos la resolución de la cámara? De esta manera podríamos ver varias cajas simultáneamente con la misma cámara (disminuyendo costos).

En este caso la cámara puede estar ubicada en el mismo punto, pero ahora el área horizontal de la escena puede ser de aproximadamente 6 metros para cubrir 4 cajas. Entonces recalculemos el lente, se requiere de: f=Dxa’/A = 5×4,8/6 = 4mm.

Y recalculamos la resolución mínima de la cámara, basándonos en 350 píxeles por metro, por lo tanto la escena deberá tener 6 x 350 = 2100 píxeles horizontales; deberá tener 2100 píxeles x 3 /4 = 1575 píxeles verticales, para una resolución total mínima de 3,3 Mega Píxeles.

Entonces en este caso la cámara efectivamente se necesitará de una resolución mucho mayor.

En ambos casos obtenemos lo deseado, solo que en el primer caso necesitamos 4 cámaras económicas y en el segundo necesitamos una sola pero más costosa. Sin embargo en el primer caso requerimos un dispositivo de grabación estándar pero con más canales y en el segundo caso con menos canales pero de excelente calidad.

La decisión viene unida a los costos asociados, pero también a la simultaneidad de las imágenes que se requieren.

d) MANTENGA LA RESOLUCIÓN DE LA IMAGEN EN TODOS LOS DISPOSITIVOS POR DONDE PASE LA IMAGEN

Es decir, sea consecuente al especificar desde la cámara hasta el monitor pasando por todos los dispositivos que administran la imagen y los que la transportan desde el sitio remoto hasta el cuarto de control. Recuerde que su sistema es tan malo, como el más malo de los dispositivos que use. De nada le sirve tener cámaras de excelente resolución, si el sistema de transmisión, de grabación o de visualización no logra mantener esa buena calidad.

CONCLUSIONES

Una vez determinado el uso que le voy a mi sistema de supervisión o vigilancia basado en Video, todo lo que necesito es ver con el detalle necesario la escena de interés. Esto lo puedo lograr de dos formas: a) Calculando un lente que se enfoque en el detalle o b) Aumentando la resolución de la cámara permitiendo el uso de un lente más amplio.

Espero que de ahora en adelante, estimado lector, no olvide hacer ambos cálculos en todos los proyectos que tenga y que reconozca la estrecha y directa relación que existe entre el cálculo del lente y el cálculo de la resolución de la cámara.

Comparte el conocimiento

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Abrir chat
1
💬 ¿Necesitas ayuda?
Scan the code
Hola 👋🏼
¿En que podemos ayudarte?