【MATLAB】P图神器,初露锋芒:第一周作业(剧透)

做完第一周Matlab作业,深感MatLab之强大。(都第几周了,才做第一周作业...)
不在上图像处理这门课的同学,也可以试试在Matlab敲这些代码哦~ 用Matlab P图可有意思呢~

第一周是粗略地体验图像处理,先把题目要求贴上来:

Write a computer program capable of reducing the number of intensity levels in an image from 256 to 2, in integer powers of 2. The desired number of intensity levels needs to be a variable input to your program.
Using any programming language you feel comfortable with (it is though recommended to use the provided free Matlab), load an image and then perform a simple spatial 3x3 average of image pixels. In other words, replace the value of every pixel by the average of the values in its 3x3 neighborhood. If the pixel is located at (0,0), this means averaging the values of the pixels at the positions (-1,1), (0,1), (1,1), (-1,0), (0,0), (1,0), (-1,-1), (0,-1), and (1,-1). Be careful with pixels at the image boundaries. Repeat the process for a 10x10 neighborhood and again for a 20x20 neighborhood. Observe what happens to the image (we will discuss this in more details in the very near future, about week 3).
Rotate the image by 45 and 90 degrees (Matlab provides simple command lines for doing this).
For every 3×3 block of the image (without overlapping), replace all corresponding 9 pixels by their average. This operation simulates reducing the image spatial resolution. Repeat this for 5×5 blocks and 7×7 blocks. If you are using Matlab, investigate simple command lines to do this important operation.
=======================

实验用图

图像处理的第一件事,是找张图片。
盗用一张自诩为艺术家的好基友拍的照片,这是我们在拉萨约会时拍的.()
图片版权归好基友,转图请注明出处。
goof
所谓的牦牛肉牛排,好韧的肉,要用好大力气吃... 还是肉牛做的牛排比较靠谱。
继续阅读“【MATLAB】P图神器,初露锋芒:第一周作业(剧透)”

[Week1.3]采样和量化——数字图像之所以是数字图像

数字图像与模拟图像的重要区别,在与它是数字的。(还能有更废的话吗...)
数字,意味着它的离散的:图像空间上的像素点是离散的,像素点的灰度值(颜色值)也是离散的。
相反,模拟图像(比如胶卷)出来的图像空间上和数值上都是连续的。

下图是JPEG的压缩编码流程,本节介绍的,是其中的“量化”(Quantizer)部分。
JPEG压缩流程
JPEG的压缩方法,可以所是非常聪明。
人眼看图像,不会太注重细节。左边一个像素与右边一个像素灰度值相差10或是11,基本不会影响理解。
简单地说,JPEG用最多的空间,来存储对人理解最重要的信息,而一些微乎其微的小细节,基本不会储存。
继续阅读“[Week1.3]采样和量化——数字图像之所以是数字图像”

[Week1.2]人类视觉系统——人是怎样看见东西的

(笔记图片截图自课程视频,使用时请注意版权要求。)
Those who wish to succeed must ask the right preliminary questions. ——Aristotle

眼球结构

眼睛通过把光投射到对光敏感的视网膜成像,在那里,光线被接受并转化成信号并通过视神经传递到脑部。通常眼睛是球状的,当中充满透明的凝胶状的物质,有一个聚焦用的晶状体,通常还有一个可以控制进入眼睛光线多少的虹膜。
课程还讲到眼睛不同结构对光的感知,哎呀我真心听乱了。
人类视觉
继续阅读“[Week1.2]人类视觉系统——人是怎样看见东西的”

[Week1.1]图像和视频处理是干啥的?

(笔记图片截图自课程Image and video processing: From Mars to Hollywood with a stop at the hospital的教学视频,使用时请注意版权要求。)

One picture is worth more than ten thousand words. ——Anonymous
生活中处处都是图像,图像也是人类感知外界的一大途径。
计算机图像和视频处理,一方面是帮助人们获得更直观的图像(将人无法直接看到的信息反映到人可以直观看见的图像上),另一方面则是让计算机去读懂图像(计算机的图像识别)。

==============

消费者图像(Consumer Image)

==============

图像压缩

如果直接存储一张未压缩的图像,它占用的存储空间会相当大。
例如,卫星拍摄一副图像,如果直接传回地球,则要占用相当大的资源,非常不划算。而如果经过压缩,它的体积可以变得比较小,传输的成本就降低了。

电影后期制作

图像处理
电影拍摄之后,总会有那么些瑕疵(或曰穿帮镜头),使用视频后期制作,它们就可以轻松拜拜了。
继续阅读“[Week1.1]图像和视频处理是干啥的?”

平衡车直立算法:互补平衡滤波

平衡车直立算法:互补平衡滤波
——结合加速度计和陀螺仪的平衡解决方案
Adapted from Shane Colton, The Balance Filter.
翻译 + 改编 by肥叉烧

图片1

传感器

两轴加速度计

1. 用于测量“加速度”,但实际是测量单位质量上的受力。(F = ma,于是有a = F/m,牛顿就这么一说~)
2. 可用于测量重力,如上图,X轴的读数为0,Y轴的读数为-1g.
3. 可用于测量倾斜度:如上图,这时X轴和Y轴都有读数,通过简单的三角函数计算,就可以算得当前的倾斜度。(嗯,高中的我一定能轻松算出来~)

陀螺仪

1. 用于测量“角速度”(旋转的速度)。
2. 静止时读数为0.
3. 旋转时,读数是正数或者负数:与陀螺仪方向一致读数为正,否则为负。
继续阅读“平衡车直立算法:互补平衡滤波”